本公开涉及人群画像生成领域,且更为具体地,涉及一种基于大数据的直播间人群画像生成方法及其系统。
背景技术:
1、直播行业蓬勃发展,直播平台上的用户数量庞大。生成直播间人群画像可以更好地了解和理解直播用户,从而提供个性化的内容推荐、精准的广告投放、精细化的用户管理等服务。通过人群画像,直播平台可以更好地把握用户的需求和兴趣,提供符合用户偏好的直播内容,提升用户体验和留存率。
2、但是,在直播平台的运行过程中留下的大量数据通常是庞杂的、杂乱无章的,如何处理与分析这些数据,并精准地生成直播间人群画像是一个重要的技术问题。
技术实现思路
1、有鉴于此,本公开提出了一种基于大数据的直播间人群画像生成方法及其系统,其可以更全面地了解用户的兴趣、需求和行为模式。
2、根据本公开的一方面,提供了一种基于大数据的直播间人群画像生成方法,其包括:
3、获取被分析直播用户的基本信息、互动数据和消费数据;
4、对所述被分析直播用户的基本信息、互动数据和消费数据进行数据清洗与结构化表示以得到用户基本信息编码向量、用户互动编码向量和用户消费编码向量;
5、对所述用户基本信息编码向量、所述用户互动编码向量和所述用户消费编码向量进行语义分析以得到用户信息多尺度融合关联特征向量;以及
6、基于所述用户信息多尺度融合关联特征向量,生成人群画像。
7、根据本公开的另一方面,提供了一种基于大数据的直播间人群画像生成系统,其包括:
8、数据获取模块,用于获取被分析直播用户的基本信息、互动数据和消费数据;
9、数据清洗与结构化表示模块,用于对所述被分析直播用户的基本信息、互动数据和消费数据进行数据清洗与结构化表示以得到用户基本信息编码向量、用户互动编码向量和用户消费编码向量;
10、语义分析模块,用于对所述用户基本信息编码向量、所述用户互动编码向量和所述用户消费编码向量进行语义分析以得到用户信息多尺度融合关联特征向量;以及
11、人群画像生成模块,用于基于所述用户信息多尺度融合关联特征向量,生成人群画像。
12、根据本公开的实施例,其首先获取被分析直播用户的基本信息、互动数据和消费数据,接着,对所述被分析直播用户的基本信息、互动数据和消费数据进行数据清洗与结构化表示以得到用户基本信息编码向量、用户互动编码向量和用户消费编码向量,然后,对所述用户基本信息编码向量、所述用户互动编码向量和所述用户消费编码向量进行语义分析以得到用户信息多尺度融合关联特征向量,最后,基于所述用户信息多尺度融合关联特征向量,生成人群画像。这样,可以更全面地了解用户的兴趣、需求和行为模式。
1.一种基于大数据的直播间人群画像生成方法,其特征在于,包括:
2.根据权利要求1所述的基于大数据的直播间人群画像生成方法,其特征在于,对所述用户基本信息编码向量、所述用户互动编码向量和所述用户消费编码向量进行语义分析以得到用户信息多尺度融合关联特征向量,包括:
3.根据权利要求2所述的基于大数据的直播间人群画像生成方法,其特征在于,提取所述用户基本信息编码向量、所述用户互动编码向量和所述用户消费编码向量之间的用户信息全局关联特征以得到用户信息全局关联特征向量,包括:
4.根据权利要求3所述的基于大数据的直播间人群画像生成方法,其特征在于,提取所述用户基本信息编码向量、所述用户互动编码向量和所述用户消费编码向量之间的上下文语义关联特征以得到用户信息上下文语义关联特征向量,包括:
5.根据权利要求4所述的基于大数据的直播间人群画像生成方法,其特征在于,融合所述用户信息全局关联特征向量和所述用户信息上下文语义关联特征向量以得到所述用户信息多尺度融合关联特征向量,包括:
6.根据权利要求5所述的基于大数据的直播间人群画像生成方法,其特征在于,基于所述用户信息多尺度融合关联特征向量,生成人群画像,包括:
7.根据权利要求6所述的基于大数据的直播间人群画像生成方法,其特征在于,还包括训练步骤:对所述基于全连接层的用户信息全局关联特征提取器、所述基于转换器的用户信息上下文语义关联特征提取器和所述基于aigc的人群画像生成器进行训练;
8.根据权利要求7所述的基于大数据的直播间人群画像生成方法,其特征在于,对所述训练用户信息多尺度融合关联特征向量进行特征分布优化以得到优化训练用户信息多尺度融合关联特征向量,包括:
9.一种基于大数据的直播间人群画像生成系统,其特征在于,包括:
10.根据权利要求9所述的基于大数据的直播间人群画像生成系统,其特征在于,所述语义分析模块,包括:
