网络用户的情感倾向判定方法、装置、设备及存储介质与流程

专利2024-11-10  58



1.本公开涉及数据处理技术领域,尤其涉及一种网络用户的情感倾向判定方法、装置、设备及存储介质。


背景技术:

2.随着社交媒体的发展,越来越多的人在社交媒体上发表自己对某一事件的评论,而这些评论通常代表着用户的立场和情感。
3.在开源社交媒体中开展舆论事件调查分析时,需要推断网络用户对特定事件的情感倾向,现有方法主要仅针对某一网络用户发布的单条评论信息的内容来进行语义分析并推断。而在开源社交媒体中,网络用户对舆论事件发表的评论通常与舆论事件的背景知识存在关联,当前消息的理解依赖于舆论事件整体的背景知识,因此现有方法难以捕捉网络用户的真实观点,对网络用户情感倾向的判定不准确。


技术实现要素:

4.为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种网络用户的情感倾向判定方法、装置、设备及存储介质。
5.第一方面,本公开提供了一种网络用户的情感倾向判定方法,包括:
6.获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;
7.根据所述第一评论信息构建所述目标事件的知识图谱;
8.基于所述知识图谱对所述第二评论信息进行情感分析,得到第一情感倾向值;
9.至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。
10.可选的,所述方法还包括:
11.基于立场检测模型对所述第二评论信息进行情感分析,得到第二情感倾向值,所述立场检测模型基于所述第一评论信息训练得到;
12.所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向,包括:
13.基于所述第一情感倾向值和所述第二情感倾向值,确定所述对象对于所述目标事件的情感倾向。
14.可选的,所述方法还包括:
15.获取被所述对象执行目标操作的至少一个和所述目标事件相关的第三评论信息;
16.针对每个第三评论信息进行情感分析,得到每个第三评论信息对应的第三情感倾向值,并针对所述第三情感倾向值进行加权平均,得到第四情感倾向值;
17.所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向,包括:
18.基于所述第一情感倾向值和所述第四情感倾向值,确定所述对象对于所述目标事
件的情感倾向。
19.可选的,所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向之前,还包括:
20.获取所述对象对所述目标事件的至少一个第四评论信息,所述第四评论信息为所述第二评论信息之前的历史评论信息;
21.基于所述知识图谱确定所述第四评论信息与所述第二评论信息之间的关联程度,将所述程度作为所述第四评论信息的关联系数;
22.对所述第四评论信息的关联系数进行加权平均得到平均关联系数;
23.根据所述平均关联系数对所述第一情感倾向值进行修正,得到修正后的第一情感倾向值;
24.所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向,包括:
25.至少基于修正后的第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。
26.可选的,所述立场检测模型包括立场目标检测子模型、立场主题检测子模型和立场情感检测子模型;
27.所述基于立场检测模型对所述第二评论信息进行情感分析,得到第二情感倾向值,包括:
28.基于所述立场目标检测子模型,根据所述第二评论信息确定立场目标;
29.基于所述立场主题检测子模型,根据所述第二评论信息确定所述立场目标的立场主题;
30.基于所述立场情感检测子模型,根据所述第二评论信息确定所述立场主题的情感强度;
31.根据所述立场目标、所述立场主题和所述情感强度确定所述第二情感倾向值。
32.第二方面,本公开提供了一种网络用户的情感倾向判定装置,包括:
33.获取模块,获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;
34.处理模块,用于根据所述第一评论信息构建所述目标事件的知识图谱;
35.分析模块,用于基于所述知识图谱对所述第二评论信息进行情感分析,得到第一情感倾向值;
36.判定模块,用于至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。
37.可选的,所述分析模块还用于基于立场检测模型对所述第二评论信息进行情感分析,得到第二情感倾向值,所述立场检测模型基于所述第一评论信息训练得到;
38.所述判定模块在所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向时,具体用于基于所述第一情感倾向值和所述第二情感倾向值,确定所述对象对于所述目标事件的情感倾向。
39.可选的,所述获取模块还用于获取被所述对象执行目标操作的至少一个和所述目标事件相关的第三评论信息;
40.所述分析模块还用于针对每个第三评论信息进行情感分析,得到每个第三评论信息对应的第三情感倾向值,并针对所述第三情感倾向值进行加权平均,得到第四情感倾向值;
41.所述判定模块在所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向,具体用于基于所述第一情感倾向值和所述第四情感倾向值,确定所述对象对于所述目标事件的情感倾向。
42.第三方面,本公开提供了一种电子设备,包括:
43.存储器;
44.处理器;以及
45.计算机程序;
46.其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。
47.第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法。
48.本公开提供的技术方案与现有技术相比具有如下优点:
49.本公开提供的网络用户的情感倾向判定方法、装置、设备及存储介质,通过获取网络用户对目标事件评论的第一评论信息来构建目标事件的知识图谱,基于知识图谱对判定对象发布第二评论信息进行情感分析,能通过知识图谱中包含的目标事件的背景知识来补齐第二评论信息,可以更加准确地确定第二评论信息对应的语义,让对第二评论信息的情感分析结合了目标事件的背景知识,从而得到更加准确的第一情感倾向值,最终由第一情感倾向值确定判定对象的情感倾向,提高了情感倾向判定的准确性。
附图说明
50.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
51.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
52.图1为本公开实施例提供的一种网络用户的情感倾向判定方法流程图;
53.图2为本公开又一实施例提供的一种网络用户的情感倾向判定方法流程图;
54.图3为本公开又一实施例提供的一种网络用户的情感倾向判定方法流程图;
55.图4为本公开实施例提供的一种网络用户的情感倾向判定装置的结构示意图;
56.图5为本公开实施例提供的电子设备的结构示意图。
具体实施方式
57.为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
58.在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采
用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
59.现有方法根据网络用户发布的评论信息进行情感倾向判定,仅针对某一网络用户发布的单条评论信息的内容来进行语义分析并推断,导致难以捕捉网络用户的真实观点,对网络用户情感倾向的判定不准确。具体原因包括以下几点:一、在开源社交媒体中,网络用户用户发布的评论与舆论事件的背景知识存在关联,一些情况下网络用户当前发布的评论还可能与之前发布的评论有关联,当前消息的理解依赖于舆论事件整体的背景知识和网络用户历史评论的表述。二、网络用户用户发布的消息往往并不是直接表达自身立场倾向,评论中包含的目标不一定是该评论的评论对象,该评论可能是对目标的某一方面或目标的相反内容表达立场。三、社交网络中存在着大量的“潜水者”,他们不主动发声,但会以行为来表达自己的观点,例如对已有评论点赞、转发等,而现有方法忽略了网络用户用户的行为数据。
60.针对上述问题,本公开实施例提供了一种网络用户的情感倾向判定方法,下面结合具体的实施例对该方法进行介绍。
61.图1为本公开实施例提供的一种网络用户的情感倾向判定方法流程图,该方法可以由网络用户的情感倾向判定装置执行,该网络用户的情感倾向判定装置可以采用软件和/或硬件的方式实现,该网络用户的情感倾向判定装置可配置于电子设备中,例如服务器或终端,其中,终端具体包括手机、电脑或平板电脑等。该方法具体包括如下步骤:
62.s101、获取网络用户对目标事件评论的第一评论信息,以及对象对目标事件的第二评论信息。
63.第一评论信息和第二评论信息均可以通过开源社交媒体获取。其中,第一评论信息用于在后续步骤中构建知识图谱,表达与目标事件相关的背景知识,实现联系上下文对某一评论进行情感判定。因此收集的第一评论信息是对目标事件进行评论的全部网络用户的评论信息,关于目标事件的评论信息,如此可以极大地丰富关于目标事件的背景知识。
64.第二评论信息是作为判定对象的网络用户对目标事件的当前评论信息,由于在舆论事件发展的过程中,网络用户的情感倾向可能会随着舆论事件信息的披露或事件变化而随之改变,对网络用户的情感倾向的判定由当前发布的评论来进行。示例性的,可以在开源社交媒体中选择点赞数量排名靠前的多个评论来作为第二评论信息,分别对选取的每个评论来进行情感倾向判定,确定发布这些评论的网络用户的情感倾向,也可以在第一评论信息中选取一些用户的评论信息进行情感判定。
65.s102、根据第一评论信息构建目标事件的知识图谱。
66.知识图谱通常采用(头实体,关系,尾实体)的三元组形式组织知识,这种符号表示方式将知识图谱中的实体和关系用不同的符号节点表示。知识图谱可以表示目标事件中的人物、事物以及人物事物之间的关系,因此可以很好的体现目标事件所包含的背景知识。
67.根据获取的对目标事件的第一评论信息构建知识图谱,作为目标事件的舆情知识库,来实现结合目标事件的背景知识来对网络用户发布的评论进行情感倾向判定。
68.s103、基于知识图谱对第二评论信息进行情感分析,得到第一情感倾向值。
69.因为在网络用户对目标事件进行评论的过程中,通常会对已披露舆情信息进行评论,评论中所包含的信息并不完全,导致从单句评论来分析评论的语义不准确,因此利用知
识图谱中关于目标事件实体以及实体之间的关系,来对评论中包含的实体以及关系进行推理,丰富评论中的背景知识,可以更准确的确定评论的语义,得到对评论更加全面的语义表示,从而使得情感分析得到的情感倾向值更准确。通过知识图谱中的实体和实体之间的关系,对第二评论信息中所包含的实体和实体关系进行推理,得到对第二评论信息丰富背景知识后的语义表示,并对该语义表示进行情感分析,得到第一情感倾向值。
70.由于在实际应用中,通过知识图谱进行关系推理需要复杂的图算法操作这些符号,导致效率低下,难以满足大规模实时计算的需求。因此可以采用可计算性强的分布式表示学习,在低维向量空间中进行知识图谱的表示,将关系推理转化为简单的向量操作。
71.本公开采用基于共享向量表示的神经网络模型(senn,shared embedding based neural network)进行关系推理。senn中关系推理任务被归结为以下子任务:给定关系和尾实体,预测头实体;给定头实体和尾实体,预测关系;给定头实体和关系,预测尾实体。senn直接建模关系推理的以上三个子任务,同时,通过共享向量表示,在一个统一的神经网络框架中集成这三个子任务。为此,senn包括两个主要的组成部分:两个共享表示矩阵,分别对应实体表示矩阵和关系表示矩阵,以及三个子结构,分别对应头实体、关系和尾实体预测。这里,不同预测子任务之间的交互通过实体和关系的共享向量表示矩阵捕捉。三个预测子任务分开建模,得到三个类似的预测子结构,允许使用不同的给定信息进行预测指定的推理。直观地,预测是一个逐步接近目标的过程。为此,senn采用维度递减的全连接神经网络模拟这个过程,从相对多的信息,逐步推理锁定目标。此外,本公开还基于以下考虑设计了一个自适应加权损失机制。一方面,三元组可以根据它们关系的映射属性分为四类:一对一,一对多,多对一和多对多。例如,一对多是指对于这种类型的关系,一个头实体可能对应多个尾实体。类似地,给定头实体和尾实体,可能对应多种关系。很显然,答案只有一个实体/关系的预测相比于有多个的预测确定性更高。换句话说,预测具有的答案个数越多,确定性越低。为此,在训练过程中,该项目给予做错相对确定的预测更重的惩罚,也即,损失的权重与预测对应的有效实体/关系数关联,该项目用它们的倒数加权对应的损失。另一方面,关系预测由于候选集更小,实验证明它比实体预测更为简单,效果更好。为此,本公开给头尾实体预测乘上额外的大于1的权重因子w,鼓励senn学好难的预测任务。
72.示例性的,参照上述运算过程,可以对第二评论信息,利用知识图谱中关于目标事件实体以及实体之间的关系,结合知识图谱在低维向量空间的状态空间表示,建立第二评论信息对应的状态空间表示,由此将第二评论信息转化为向量表示,之后通过上述senn模型进行关系推理,提高运算速度,可以快速的生成第二评论信息对应的第一情感倾向值。
73.s104、至少基于第一情感倾向值,确定对象对于目标事件的情感倾向。
74.基于情感倾向值和不同类型情感倾向之间映射关系,确定第一情感倾向值所对应的情感倾向,从而确定对象当前对于目标事件的情感倾向。例如第一情感倾向值为(0,0,1),对应的情感倾向为支持,其中向量的不同坐标表示不同的情感类型,例如(反对,中立,支持),从而将(0,0,1)对应的情感倾向确定为支持。对于情感倾向值与不同类型情感倾向之间映射关系可以根据自身需求和算法来进行设定,本公开实施例不作具体限定。
75.本公开实施例通过获取网络用户对目标事件评论的第一评论信息来构建目标事件的知识图谱,基于知识图谱对判定对象发布第二评论信息进行情感分析,能通过知识图谱中包含的目标事件的背景知识来补齐第二评论信息,可以更加准确地确定第二评论信息
对应的语义,让对第二评论信息的情感分析结合了目标事件的背景知识,从而得到更加准确的第一情感倾向值,最终由第一情感倾向值确定判定对象的情感倾向,提高了情感倾向判定的准确性。
76.图2为本公开又一实施例提供的一种网络用户的情感倾向判定方法流程图,该方法具体包括如下步骤:
77.s201、获取网络用户对目标事件评论的第一评论信息,以及对象对目标事件的第二评论信息。
78.具体的,s201和s101的实现过程和原理一致,此处不再赘述。
79.s202、根据第一评论信息构建目标事件的知识图谱。
80.具体的,s202和s102的实现过程和原理一致,此处不再赘述。
81.s203、基于知识图谱对第二评论信息进行情感分析,得到第一情感倾向值。
82.具体的,s203和s103的实现过程和原理一致,此处不再赘述。
83.s204、基于立场检测模型对第二评论信息进行情感分析,得到第二情感倾向值,立场检测模型基于第一评论信息训练得到。
84.立场检测主要是从网络用户发布的评论内容中挖掘用户关于某一特定目标的立场信息,该目标可以为某个人、某一事件或者某一具体事物等。基于特定目标的立场检测与基于特定目标的情感分类相似,二者的主要区别在于,后者中的目标出现在文本中且标注位置,而基于特定目标的立场检测,目标不一定是文本的评论对象,文本可能是对目标的某一方面或目标的相反内容表达立场,此外,文本所表达的立场与情感极性并不总是相同,因此通过检测网络用户发布的评论所表达的真实立场有助于情感倾向判定。
85.使用对目标事件评论信息来训练立场检测模型,可以使得立场检测模型对关于目标事件的评论的立场检测更加准确。上文已经介绍过,收集的第一评论信息是对目标事件进行评论的全部网络用户的评论信息,本公开实施例所提供的立场检测模型基于第一评论信息训练得到,因此对目标事件的第二评论信息的立场检测会更加准确。
86.示例性的,本公开实施例通过自然语言(bert)模型获取第二评论信息的词向量表达,将该词向量表达输入立场检测模型进行侧重于立场检测的情感分析,得到第二情感倾向值。
87.s205、基于第一情感倾向值和第二情感倾向值,确定对象对于目标事件的情感倾向。
88.将第二情感倾向值作为第一情感倾向值的偏置量,通过对第一情感倾向值和第二情感倾向值进行加权求和得到二者之和,根据二者之和所对应的情感倾向类型确定对象对于目标事件的情感倾向。
89.本公开实施例通过基于第一评论信息训练得到的立场检测模型对第二评论信息进行情感分析,得到第二情感倾向值,结合第一情感倾向值和第二情感倾向值来确定对象对于目标事件的情感倾向,使情感倾向的判定结合了判定对象所表达的真实立场,从而让情感倾向的判定结果更加准确。
90.图3为本公开又一实施例提供的一种网络用户的情感倾向判定方法流程图,该方法具体包括如下步骤:
91.s301、获取网络用户对目标事件评论的第一评论信息,以及对象对目标事件的第
二评论信息。
92.具体的,s301和s101的实现过程和原理一致,此处不再赘述。
93.s302、根据第一评论信息构建目标事件的知识图谱。
94.具体的,s302和s102的实现过程和原理一致,此处不再赘述。
95.s303、基于知识图谱对第二评论信息进行情感分析,得到第一情感倾向值。
96.具体的,s303和s103的实现过程和原理一致,此处不再赘述。
97.s304、获取被对象执行目标操作的至少一个和目标事件相关的第三评论信息。
98.目标操作包括点赞、转发等操作,因为在社交媒体中,判定对象转发、点赞一条评论等操作同样也可以体现判定对象的情感倾向,而且社交媒体中一部分网络用户很少主动发表评论表达自身情感,但是他们会选择通过这些行为来表达自己的立场。因此可以通过将目标操作的类型划分为不同情感类型后,再确定被对象执行目标操作的评论的情感倾向,最终来确定判定对象的情感倾向,例如目标操作是点赞,代表赞同被执行目标操作的评论,评论的情感倾向的类型是支持,则代表着判定对象这一执行目标操作的行为的情感倾向是支持。此外,执行目标操作所对应的时序数据中蕴含了网络用户的情感倾向随时间演变的规律信息,能够帮助实现对网络用户更精确的刻画。因此,将时序数据进行有效建模,能够更好地捕获网络用户的行为模式,进而挖掘用户的情感倾向。
99.s305、针对每个第三评论信息进行情感分析,得到每个第三评论信息对应的第三情感倾向值,并针对第三情感倾向值进行加权平均,得到第四情感倾向值。
100.通过对被执行目标操作的第三评论信息进行情感分析,得到每个第三评论信息对应的第三情感倾向值,而后基于目标操作的时序信息对第三情感倾向值进行加权平均,例如,对第三评论信息执行点赞操作的时间距离判定当前情感倾向的时间越近,则被点赞的第三评论信息对应第三情感倾向值的权重越大。示例性的,也可以通过对目标操作对应的时序信息进行时序建模来针对第三情感倾向值进行加权平均。根据目标操作对应的时序信息对第三情感倾向值加权平均以得到第四情感倾向值。
101.s306、基于第一情感倾向值和第四情感倾向值,确定对象对于目标事件的情感倾向。
102.具体的,s306和s205的实现过程和原理一致,此处不再赘述。
103.本公开实施例通过获取被对象执行目标操作的和目标事件相关的第三评论信息,针对第三评论信息进行情感分析得到第三情感倾向值,而后针对得到的第三情感倾向值,基于执行目标操作对应的时序信息进行加权平均得到第四情感倾向值,最后结合第一情感倾向值和第四情感倾向值来确定对象对于目标事件的情感倾向,使情感倾向的判定结合了判定对象的行为信息,从而让情感倾向的判定结果更加准确。
104.在一些实施例中,还可以基于第一情感倾向值、第二情感倾向值和第四情感倾向值,来确定对象对于目标事件的情感倾向,进一步提高情感倾向判定的准确度。
105.在上述实施例的基础上,在至少基于第一情感倾向值,确定对象对于目标事件的情感倾向之前,还包括:获取对象对目标事件的至少一个第四评论信息,第四评论信息为第二评论信息之前的历史评论信息;基于知识图谱确定第四评论信息与第二评论信息之间的关联程度,将程度作为第四评论信息的关联系数;对第四评论信息的关联系数进行加权平均得到平均关联系数;根据平均关联系数对第一情感倾向值进行修正,得到修正后的第一
情感倾向值;至少基于第一情感倾向值,确定对象对于目标事件的情感倾向,包括:至少基于修正后的第一情感倾向值,确定对象对于目标事件的情感倾向。
106.上文中已介绍在对第二评论信息进行情感分析确定情感倾向时,结合目标事件的背景知识进行情感分析会使确定的情感倾向更准确,原因是第二评论信息是基于目标事件的具体情况发布的,因此第二评论信息的语义确定需要结合目标事件的背景知识。在其中还包括一种情况,当判定对象发布的第二评论信息是基于在第二评论信息之前的评论信息进行评论的时候,此时就需要结合判定对象在第二评论信息之前发布的历史评论信息来对第二评论信息进行情感分析。
107.通过获取判定对象在发布第二评论信息之前发布的第四评论信息,而后根据知识图谱来确定每个第四评论信息与第二评论信息之间的关联程度,将关联程度作为每个第四评论信息对应的关联系数,而后对关联系数进行加权平均得到平均关联系数。示例性的,可以根据上文介绍的知识图谱的状态空间表示方法,使用senn利用知识图谱中包含的实体和实体间关系,推理第四评论信息包含的实体和实体关系,生成第四评论信息融入背景知识后的状态空间表示,然后使用senn的注意力机制利用知识图谱来推断每条第四评论信息与第二评论信息之间的关联,得到每个消息的关联系数,最后采用加权平均的方式得到平均关联系数。得到平均关联系数后,将平均关联系数与第一情感倾向值相乘,得到乘积即作为修正后的第一情感倾向值,最终根据修正后的第一情感倾向值,确定对象对于目标事件的情感倾向。
108.本公开实施例通过获取对象在第二评论信息发布的第四评论信息,并基于知识图谱来确定第四评论信息与第二评论信息之间的关联程度,得到关联系数,然后对关联系数进行加权平均得到平均关联系数,使平均关联系数对第一情感倾向值进行修正,最后根据修正后的第一情感倾向值来确定对象对于目标事件的情感倾向,通过让第二评论信息的情感分析结合历史评论信息,使情感倾向的判定结合了判定对象发布的历史评论信息,从而让情感倾向的判定结果更加准确。
109.在上述实施例的基础上,立场检测模型包括立场目标检测子模型、立场主题检测子模型和立场情感检测子模型;基于立场检测模型对第二评论信息进行情感分析,得到第二情感倾向值,包括:基于立场目标检测子模型,根据第二评论信息确定立场目标;基于立场主题检测子模型,根据第二评论信息确定立场目标的立场主题;基于立场情感检测子模型,根据第二评论信息确定立场主题的情感强度;根据立场目标、立场主题和情感强度确定第二情感倾向值。
110.立场目标为判定目标发布评论信息来表达立场所针对的某一人物或事物,立场目标能够对文本的立场的判断提供有效帮助,不过立场目标信息通常非常简短,难以明确确定判定目标对立场目标的态度。尽管网络用户通常未明确表达立场目标的态度,对但通常会讨论一个或多个与目标相关的主题,并表达对这些主题的态度,从而隐含地表达其对目标的观点。而文本的情感一定程度上反应了网络用户针对讨论主题所持立场的强度,对于立场判断有一定的积极作用。
111.其中立场目标检测子模型用于检测第二评论信息表达立场所针对的立场目标,立场主题检测子模型用于检测在立场目标下第二评论信息讨论的立场主题,立场情感检测子模型用于检测第二评论信息表达出来对讨论的立场主题的情感强度,由立场目标、立场主
题和情感强度即可确定第二评论信息对应的第二情感倾向值。
112.示例性的,本公开提供了一种基于情感辅助的多头注意力双向长短期记忆网络(bi-lstm)立场检测模型。该模型主要分为三部分,分别用于生成基于立场目标的文本表示、基于立场主题的文本表示和基于立场情感的文本表示,即立场目标检测子模型、立场主题检测子模型和立场情感检测子模型。
113.双向长短期记忆网络(bi-lstm),通过正向lstm捕捉文本的上文语义,反向lstm捕捉文本的下文语义,通过将双向的lstm隐层输出进行拼接,从而获得更多的上下文信息,更好地进行文本表示,采用双向长短期记忆网络(bi-lstm)对bert模型生成的文本词向量[x1,x2,

,xn]建模,得到高阶文本表示[h1,h2,

,hn],从而捕获更多的文本信息。其中第t个文本词向量x
t
对应的高阶文本向量h
t
的形式如下:
[0114][0115][0116][0117]
而后使用隐含狄利克雷分布(lda,latent dirichlet allocation)主题模型获取文本的k个主题信息,对于每个主题ti,采用该主题下前m个词的词向量表示该主题,即对于主题ti的嵌入表示,利用bert模型生成该主题下每个词对应的词嵌入表达然后根据lda模型所生成该主题下每个主题词的概率获得每个词的权重(表示源端第j个词对目标端第i个词的影响程度),进而得到该主题的嵌入表示ti。和ti的计算公式如下所示:
[0118][0119][0120]
令t
target
={t1,t2,

,tk}表示k个主题信息,t
target
表示立场目标信息的嵌入表示。
[0121]
立场检测侧重于面向目标词的立场识别,识别文本的立场倾向性的核心在于该文本中与目标词显著相关的部分。因此,本公开利用注意力机制,使得更好区分类别的特征词的权重比例大,从而更关注于特征词,减小噪音或冗余特征的影响。将立场目标和话题表示与文本中的隐层表达进行匹配,得到文本中每个隐层表达的相关性权重。
[0122]
对于每个主题ti,注意力机制分配权重的形式如下所示:
[0123]
[0124][0125]
其中hj为高阶文本词向量表示[h1,h2,

,hn]中第j个高阶文本词向量,为主题表示中第j个词的词向量,为注意力权重。
[0126]
再将双向lstm隐层输出[h1,h2,

,hn]与注意力权重加权得到针对于主题ti的文本表示si。
[0127][0128]
最终得到k+1个文本表示,分别为基于立场主题的文本表示{s1,s2,

,sk}和基于立场目标的文本表示s
target
。上述机制可以被视为多头注意力机制,每个主题ti是一个注意力机制的查询向量。
[0129]
文本的情感一定程度上反应了网络用户用户针对讨论主题所持立场态度的强度,对于立场判断有一定的积极作用。基于此,本文提出预训练情感辅助分类器,使文本的情感表达参与文本的立场判断。情感辅助分类器采用bi-lstm模型训练,将bert模型生成的文本词向量[x1,x2,

,xn],输入bi-lstm模型得到基于情感的文本表示s
senti
=[h1,h2,

,hn]。
[0130]
基于每个文本,lda模型会生成其属于每个主题的概率pi,因此本文将基于主题的文本表示按照该文本的主题分布概率进一步融合,具体形式如下:
[0131]stopics
=σipisi[0132]
最终文本表示为基于立场目标的文本表示s
target
、基于立场主题的文本表示s
topics
和基于立场情感的文本表示s
senti
的拼接,具体形式如下。
[0133][0134]
使用全连接层产生最终的分类结果,再通过归一化指数(softmax)函数输出每个情感类型的预测概率,生成情感倾向值。
[0135]
本公开实施例提供的立场检测模型分为三部分,通过分别检测第二评论信息的立场目标、立场目标下的立场主题和立场主题的情感强度,来准确捕捉第二评论信息所表达的立场,从而辅助于情感倾向的判定,使情感倾向判定更准确。
[0136]
图4为本公开实施例提供的一种网络用户的情感倾向判定装置的结构示意图,该装置可以作为组件配置在终端中,用以执行网络用户的情感倾向判定方法实施例提供的处理流程。网络用户的情感倾向判定装置400包括:获取模块401,获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;处理模块402,用于根据第一评论信息构建目标事件的知识图谱;403分析模块,用于基于知识图谱对第二评论信息进行情感分析,得到第一情感倾向值;判定模块404,用于至少基于第一情感倾向值,确定对象对于目标事件的情感倾向。
[0137]
可选的,分析模块403还用于基于立场检测模型对第二评论信息进行情感分析,得到第二情感倾向值,立场检测模型基于第一评论信息训练得到;判定模块404在至少基于第
一情感倾向值,确定对象对于目标事件的情感倾向时,具体用于基于第一情感倾向值和第二情感倾向值,确定对象对于目标事件的情感倾向。
[0138]
可选的,获取模块401还用于获取被对象执行目标操作的至少一个和目标事件相关的第三评论信息;分析模块403还用于针对每个第三评论信息进行情感分析,得到每个第三评论信息对应的第三情感倾向值,并针对第三情感倾向值进行加权平均,得到第四情感倾向值;判定模块404在至少基于第一情感倾向值,确定对象对于目标事件的情感倾向,具体用于基于第一情感倾向值和第四情感倾向值,确定对象对于目标事件的情感倾向。
[0139]
可选的,在至少基于第一情感倾向值,确定对象对于目标事件的情感倾向之前,获取模块401还用于获取对象对目标事件的至少一个第四评论信息,第四评论信息为第二评论信息之前的历史评论信息;分析模块403还用于基于知识图谱确定第四评论信息与第二评论信息之间的关联程度,将程度作为第四评论信息的关联系数;对第四评论信息的关联系数进行加权平均得到平均关联系数;根据平均关联系数对第一情感倾向值进行修正,得到修正后的第一情感倾向值;判定模块在至少基于第一情感倾向值,确定对象对于目标事件的情感倾向时,具体用于至少基于修正后的第一情感倾向值,确定对象对于目标事件的情感倾向。
[0140]
可选的,立场检测模型包括立场目标检测子模型、立场主题检测子模型和立场情感检测子模型;分析模块在基于立场检测模型对第二评论信息进行情感分析,得到第二情感倾向值时,具体用于基于立场目标检测子模型,根据第二评论信息确定立场目标;基于立场主题检测子模型,根据第二评论信息确定立场目标的立场主题;基于立场情感检测子模型,根据第二评论信息确定立场主题的情感强度;根据立场目标、立场主题和情感强度确定第二情感倾向值。
[0141]
图4所示实施例的网络用户的情感倾向判定装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
[0142]
图5为本公开实施例提供的电子设备的结构示意图。本公开实施例提供的电子设备可以执行网络用户的情感倾向判定方法实施例提供的处理流程,如图5所示,电子设备500包括:存储器501、处理器502、计算机程序和通讯接口503;其中,计算机程序存储在存储器501中,并被配置为由处理器502执行如上所述的网络用户的情感倾向判定方法。
[0143]
另外,本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的网络用户的情感倾向判定方法。
[0144]
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0145]
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开
将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:
1.一种网络用户的情感倾向判定方法,其特征在于,包括:获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;根据所述第一评论信息构建所述目标事件的知识图谱;基于所述知识图谱对所述第二评论信息进行情感分析,得到第一情感倾向值;至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。2.如权利要求1所述的方法,其特征在于,所述方法还包括:基于立场检测模型对所述第二评论信息进行情感分析,得到第二情感倾向值,所述立场检测模型基于所述第一评论信息训练得到;所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向,包括:基于所述第一情感倾向值和所述第二情感倾向值,确定所述对象对于所述目标事件的情感倾向。3.如权利要求1所述的方法,其特征在于,所述方法还包括:获取被所述对象执行目标操作的至少一个和所述目标事件相关的第三评论信息;针对每个第三评论信息进行情感分析,得到每个第三评论信息对应的第三情感倾向值,并针对所述第三情感倾向值进行加权平均,得到第四情感倾向值;所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向,包括:基于所述第一情感倾向值和所述第四情感倾向值,确定所述对象对于所述目标事件的情感倾向。4.如权利要求1所述的方法,其特征在于,所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向之前,还包括:获取所述对象对所述目标事件的至少一个第四评论信息,所述第四评论信息为所述第二评论信息之前的历史评论信息;基于所述知识图谱确定所述第四评论信息与所述第二评论信息之间的关联程度,将所述程度作为所述第四评论信息的关联系数;对所述第四评论信息的关联系数进行加权平均得到平均关联系数;根据所述平均关联系数对所述第一情感倾向值进行修正,得到修正后的第一情感倾向值;所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向,包括:至少基于修正后的第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。5.如权利要求2所述的方法,其特征在于,所述立场检测模型包括立场目标检测子模型、立场主题检测子模型和立场情感检测子模型;所述基于立场检测模型对所述第二评论信息进行情感分析,得到第二情感倾向值,包括:基于所述立场目标检测子模型,根据所述第二评论信息确定立场目标;基于所述立场主题检测子模型,根据所述第二评论信息确定所述立场目标的立场主
题;基于所述立场情感检测子模型,根据所述第二评论信息确定所述立场主题的情感强度;根据所述立场目标、所述立场主题和所述情感强度确定所述第二情感倾向值。6.一种网络用户的情感倾向判定装置,其特征在于,包括:获取模块,获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;处理模块,用于根据所述第一评论信息构建所述目标事件的知识图谱;分析模块,用于基于所述知识图谱对所述第二评论信息进行情感分析,得到第一情感倾向值;判定模块,用于至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。7.如权利要求6所述的装置,其特征在于,所述分析模块还用于基于立场检测模型对所述第二评论信息进行情感分析,得到第二情感倾向值,所述立场检测模型基于所述第一评论信息训练得到;所述判定模块在所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向时,具体用于基于所述第一情感倾向值和所述第二情感倾向值,确定所述对象对于所述目标事件的情感倾向。8.如权利要求6所述的装置,其特征在于,所述获取模块还用于获取被所述对象执行目标操作的至少一个和所述目标事件相关的第三评论信息;所述分析模块还用于针对每个第三评论信息进行情感分析,得到每个第三评论信息对应的第三情感倾向值,并针对所述第三情感倾向值进行加权平均,得到第四情感倾向值;所述判定模块在所述至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向,具体用于基于所述第一情感倾向值和所述第四情感倾向值,确定所述对象对于所述目标事件的情感倾向。9.一种电子设备,其特征在于,包括:存储器;处理器;以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-5中任一项所述的方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。

技术总结
本公开涉及一种网络用户的情感倾向判定方法、装置、设备及存储介质,其中方法包括:获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;根据所述第一评论信息构建所述目标事件的知识图谱;基于所述知识图谱对所述第二评论信息进行情感分析,得到第一情感倾向值;至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。本公开使用整体网络用户的评论构建知识图谱作为目标事件的背景知识库,通过结合目标事件的背景知识来对目标对象的网络用户的评论进行情感分析,进而判定情感倾向,使得对网络用户情感倾向的判定更准确。得对网络用户情感倾向的判定更准确。得对网络用户情感倾向的判定更准确。


技术研发人员:张传新 刘春阳 张旭 刘星辰 解峥 刘少杰 张涵 陈龙 彭鑫
受保护的技术使用者:北京中科闻歌科技股份有限公司
技术研发日:2022.06.29
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-10219.html

最新回复(0)