1.本发明涉及自然语言处理技术领域,尤其涉及一种基于方面观点词情感对齐的跨领域情感分析方法及装置。
背景技术:2.情感分析是一项自动识别文本数据(如电影评论等)的情感极性的任务。目前,基于深度神经网络的情感分析模型取得了显着的性能,但训练神经网络是基于大量的标注样本训练模型才能达到比较好的预测效果。而训练样本需要大量的标记数据,而数据的标注过程需要耗费大量人力以及大量的时间。
3.为了缓解对大量标记数据依赖的问题,跨领域的情感分析任务引起了极大的关注,其将知识从标签丰富的源域转移到标签稀缺的目标域。其主要挑战是需要克服源域和目标域之间的差异,尤其是当源领域和目标领域差异较大时。面对这一挑战,许多研究提出来提取领域不变特征,在映射到同一个特征空间的时候,利用领域不变特征来减少跨领域间的域间差异。其通常基于一个域不变特征在源域和目标域中也共享相同的情感极性的假设。然而,它在许多现实场景中并不是遵守这个假设,导致情感传递错误。原因是领域不变观点特征的情感不仅取决于它们所在的领域,还取决于它们描述的方面。最近,还有一种有效的无监督域适应方法是对抗训练,它自动获得具有大规模未标记数据的域不变特征。然而,他们只关注了领域不变特征而忽略了提取特定领域的特征。随着领域差异变大,领域不变特征将受到限制,进而降低跨领域情感分析的性能。
技术实现要素:4.为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种基于方面观点词情感对齐的跨领域情感分析方法及装置。
5.本发明所采用的技术方案是:
6.一种基于方面观点词情感对齐的跨领域情感分析方法,包括以下步骤:
7.构建跨领域情感分析模型,所述跨领域情感分析模型包括预训练bert编码器、gcn自动编码器以及情感分类器;
8.将源领域与目标领域的句子输入所述预训练bert编码器进行编码,获得第一特征向量;
9.以句子为单位,将句子中指定词性的单词作为种子,通过过滤conceptnet常识知识库扩充指定词,并利用句子中的依赖关系构建出方面观点词领域常识图谱;
10.设计关系分类任务和情感对齐分类任务两个自监督任务,训练gcn自动编码器,获得包含背景常识和方面观点词情感对齐的第二特征向量;
11.将gcn自动编码器产生的第二特征向量输入图特征重构器,通过图特征重构器,图节点级别特征向量向量适应词级别的向量;
12.拼接两个编码器产生的特征向量作为句子的向量输入情感分类器,计算输入文本
所有可能极性的概率,选择概率最大的情感标签作为最终的预测情感标签,完成情感分析任务;
13.联合训练关系分类任务和情感对齐分类任务,优化跨领域情感分析模型,得到最佳的模型参数;
14.获取需要情感分析的目标领域数据,将目标领域数据输入优化后的跨领域情感分析模型,输出句子情感的预测标签。
15.进一步地,所述预训练bert编码器通过以下方式进行训练:
16.获取源领域域或者目标领域的文本,对bert编码器进行训练,以获得丰富的领域特征知识;其中,文本中每个句子的特征向量表示为:
17.xw=h
[cls]
=bert(x)
[0018]
式中,x代表的是输入的句子,h
[cls]
表示的是bert编码器句前特殊字符的隐向量表示,bert为句子编码器。
[0019]
进一步地,在方面观点词领域常识图谱中,所有句子的子图合并成为领域常识图谱的表示如下:
[0020][0021]
其中,构建出图谱中的节点vi∈v,关系三元组(vi,ri,j,vj)∈φ,其中表示为两节点vi与vj关系,φ表示的是图谱g包含的所有三元组集合。
[0022]
进一步地,所述设计关系分类任务和情感对齐分类任务两个自监督任务,训练gcn自动编码器,获得包含背景常识和方面观点词情感对齐的第二特征向量,包括:
[0023]
预测节点与节点之间的关系获得常识知识特征向量,以及利用情感对齐二元分类任务来学习方面观点对之间的情感对齐特征,从而获得包含背景常识和方面观点词情感对齐的特征向量;
[0024]
其中,特征向量的转换过程可以表示为:
[0025][0026][0027]
其中,代表节点i在关系r下的所有邻居节点;c
i,r
是可以预先设置的归一化常数;gi是随机初始化的初始节点特征向量,对其使用两步图卷积过程后,转换为hi,即为领域聚合特征向量,和是指第l层的权重矩阵;xi是节点i的特征向量表示,xj是节点j的特征向量表示。
[0028]
进一步地,所述将gcn自动编码器产生的第二特征向量输入图特征重构器,通过图特征重构器,图节点级别特征向量向量适应词级别的向量的过程中,以句子为单位,特征映射层和图特征重构器设计如下:
[0029]
xc=wcx
′c+bc[0030]
x
′
recon
=w
recon
xc+b
recon
[0031]
其中,x代表句子的向量表示,wc和bc,w
recon
和b
recon
都是权重矩阵;x
′c是x构建子图谱后通过gcn自动编码器后,平均图谱中所有节点表示所获得的句子特征向量;x
′
recon
是进过图特征重构器后获得的适应到单词级别分布空间的句子特征向量表示;xc的向量表示作
为gcn自动编码器对句子x的最终向量表示;bc是全连接层的常数向量。
[0032]
进一步地,所述图特征重构器的损失函数的表达式如下:
[0033][0034]
其中,x
′c,x
′
recon
分别是句子x构建子图谱后,将图谱输入gcn自动编码器后获得的句子特征向量表示,以及通过重构函数后获得的句子特征向量表示。
[0035]
进一步地,所述拼接两个编码器产生的特征向量作为句子的向量输入情感分类器,计算输入文本所有可能极性的概率,选择概率最大的情感标签作为最终的预测情感标签,完成情感分析任务的步骤中,句子的特征向量表示为:
[0036]
x=[xc;xw]
[0037]
其中,xc是通过带有方面观点词情感对齐的常识知识向量,xw是bert编码器产生的带有上下文信息的句子向量;[;]表示拼接向量。
[0038]
进一步地,完成情感分析任务的步骤中,输出给定句子x的情感概率,情感概率的计算公式如下:
[0039][0040]
其中,ci∈c是可能的情感极性,xi是第i个节点的向量表示。
[0041]
进一步地,所述优化跨领域情感分析模型,包括:
[0042]
采用adam优化器优化所述跨领域情感分析模型,其中,优化过程中采用的损失函数表示如下:
[0043][0044]
其中,表示的是句子向量表示重构的损失;表示的是情感分类任务的交叉熵损失函数。
[0045]
本发明所采用的另一技术方案是:
[0046]
一种基于方面观点词情感对齐的跨领域情感分析装置,包括:
[0047]
至少一个处理器;
[0048]
至少一个存储器,用于存储至少一个程序;
[0049]
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上所述方法。
[0050]
本发明的有益效果是:本发明利用对抗训练将源领域和目标领域数据映射到同一分布空间,从而提高模型从源领域迁移到目标领域的实体预测效果。
附图说明
[0051]
为了更清楚地说明本发明实施例或者现有技术中的技术方案,下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员而言,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
[0052]
图1是本发明实施例中一种基于方面观点词情感对齐的跨领域情感分析方法的流程图;
[0053]
图2是本发明实施例中基于方面观点词情感对齐的跨领域情感分析模型的结构示意图。
具体实施方式
[0054]
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0055]
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0056]
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
[0057]
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
[0058]
如图1所示,本实施例提供一种基于方面观点词情感对齐的跨领域情感分析方法的流程图,该方法构建无标注情感分析模型,模型结构如图2所示,包括bert编码器、gcn自动编码器、方面观点词情感对齐判别器,向量拼接模块,所述方法包括步骤:
[0059]
步骤1、将源领域与目标领域的句子输入所述预训练bert编码器进行编码,获得第一特征向量。
[0060]
所述预训练bert编码器是指通过大规模无标注数据预训练bert编码器来获得丰富的领域知识,文本中每个句子的特征向量表示为:
[0061]
xw=h
[cls]
=bert(x)
[0062]
其中,x代表的是输入的句子,bert为句子编码器。
[0063]
步骤2、以句子为单位,将句子中指定词性(名词、动词、形容词等)的单词作为种子,通过过滤conceptnet常识知识库扩充指定词,并利用句子中的依赖关系构建出方面观点词领域常识图谱。
[0064]
所述依赖关系是指如果句子中的指定词之间的依赖句法关系是“nsubj”、“amod”或者“xcomp”,则他们被连接为“描述”关系。最后种子过滤conceptnet创建子图,所有句子的子图合并成为领域常识图谱可以表示为:
[0065][0066]
其中,构建出图谱中的节点vi∈v,关系三元组(vi,r
i,j
,vj)∈φ,其中r
i,j
是指两节点在conceptnet中的关系。为了考虑到方面和观点词对的情感对称关系,在依赖树中有直接关系时在图谱中添加“描述”关系。
[0067]
步骤3、设计两个自监督任务,关系分类任务和情感对齐分类任务训练gcn自动编码器,即预测节点与节点之间的关系获得常识知识特征向量,以及利用情感对齐二元分类任务来学习方面观点对之间的情感对齐特征,从而获得包含背景常识和方面观点词情感对齐的特征向量。
[0068]
特征向量的转换过程可以表示为:
[0069][0070][0071]
其中,代表节点i在关系r下的所有邻居节点;c
i,r
是可以预先设置的归一化常数;gi是随机初始化的初始节点特征向量,对其使用两步图卷积过程后,转换为hi,即为领域聚合特征向量;w
r(l)
和w
0(l)
是指第l层的权重矩阵。
[0072]
步骤4、将gcn自动编码器产生的特征向量输入图特征重构器,通过图特征重构器,图节点级别特征向量向量适应词级别的向量。
[0073]
所述的特征映射层和图特征重构器是以句子为单位,设计表示如下:
[0074]
xc=wcx
′c+bc[0075]
x
′
recon
=w
recon
xc+b
recon
[0076]
其中,x代表句子的向量表示,wc和bc,w
recon
和b
recon
都是权重矩阵,x
′c是x构建子图谱后通过gcn自动编码器后,平均图谱中所有节点表示所获得的句子特征向量,x
′
recon
是进过特征重构器后获得的适应到单词级别分布空间的句子特征向量表示,而xc的向量表示作为gcn自动编码器对句子x的最终向量表示。
[0077]
因此,重构函数的损失函数使用了余弦相似度函数由下面的公式表示:
[0078][0079]
其中,x
′c,x
′
recon
分别是句子x构建子图谱后,将图谱输入gcn自动编码器后获得的句子特征向量表示,以及通过重构函数后获得的句子特征向量表示。
[0080]
步骤5、拼接两个编码器产生的向量作为句子的向量输入分类器,计算输入文本所有可能极性的概率,选择概率最大的情感标签作为最终的预测情感标签,完成情感分析任务。
[0081]
句子的特征向量可以表示为:
[0082]
x=[xc;xw]
[0083]
其中,xc是通过带有方面观点词情感对齐的常识知识向量,xw是bert编码器产生的带有上下文信息的句子向量;[;]表示拼接向量。
[0084]
因此,在完成情感分析任务的步骤中,情感概率的计算公式如下:
[0085][0086]
其中,ci∈c是可能的情感极性。
[0087]
步骤6、联合训练方面观点词情感对齐任务和情感分析任务梁并采用adam优化器以训练模型,得到最佳的参数的过程中,损失函数可以表示为:
[0088][0089]
其中,表示的是句子向量表示重构的损失;表示的是情感分类任务的交叉熵损失函数。
[0090]
步骤7、得到最终模型后,输入目标领域数据,通过最后对句子向量的分类任务输出句子情感的预测标签。
[0091]
由上可知,本实施例提供一种基于方面观点词情感对齐的跨领域情感分析方法,该方法通过自监督学习的方式挖掘观点词的情感对齐关系,可以很好的解决同一个观点词在形容不同方面词时会蕴含不同的情感极性所带来的情感迁移错误问题,从而提高模型从源领域迁移到目标领域的情感分析预测效果。
[0092]
本实施例还提供一种基于方面观点词情感对齐的跨领域情感分析装置,包括:
[0093]
至少一个处理器;
[0094]
至少一个存储器,用于存储至少一个程序;
[0095]
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现图1所示方法。
[0096]
本实施例的一种基于方面观点词情感对齐的跨领域情感分析装置,可执行本发明方法实施例所提供的一种基于方面观点词情感对齐的跨领域情感分析方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
[0097]
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
[0098]
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
[0099]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0100]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
[0101]
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0102]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0103]
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
[0104]
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
[0105]
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本技术权利要求所限定的范围内。
技术特征:1.一种基于方面观点词情感对齐的跨领域情感分析方法,其特征在于,包括以下步骤:构建跨领域情感分析模型,所述跨领域情感分析模型包括预训练bert编码器、gcn自动编码器以及情感分类器;将源领域与目标领域的句子输入所述预训练bert编码器进行编码,获得第一特征向量;以句子为单位,将句子中指定词性的单词作为种子,通过过滤conceptnet常识知识库扩充指定词,并利用句子中的依赖关系构建出方面观点词领域常识图谱;设计关系分类任务和情感对齐分类任务两个自监督任务,训练gcn自动编码器,获得包含背景常识和方面观点词情感对齐的第二特征向量;将gcn自动编码器产生的第二特征向量输入图特征重构器,通过图特征重构器,图节点级别特征向量向量适应词级别的向量;拼接两个编码器产生的特征向量作为句子的向量输入情感分类器,计算输入文本所有可能极性的概率,选择概率最大的情感标签作为最终的预测情感标签,完成情感分析任务;联合训练关系分类任务和情感对齐分类任务,优化跨领域情感分析模型,得到最佳的模型参数;获取需要情感分析的目标领域数据,将目标领域数据输入优化后的跨领域情感分析模型,输出句子情感的预测标签。2.根据权利要求1所述的一种基于方面观点词情感对齐的跨领域情感分析方法,其特征在于,所述预训练bert编码器通过以下方式进行训练:获取源领域域或者目标领域的文本,对bert编码器进行训练,以获得丰富的领域特征知识;其中,文本中每个句子的特征向量表示为:x
w
=h
[cls]
=bert(x)式中,x代表的是输入的句子,h
[cls]
表示的是bert编码器句前特殊字符的隐向量表示,bert为句子编码器。3.根据权利要求1所述的一种基于方面观点词情感对齐的跨领域情感分析方法,其特征在于,在方面观点词领域常识图谱中,所有句子的子图合并成为领域常识图谱的表示如下:其中,构建出图谱中的节点v
i
∈v,关系三元组(v
i
,r
i,j
,v
j
)∈φ,其中表示为两节点v
i
与v
j
关系,φ表示的是图谱g包含的所有三元组集合。4.根据权利要求1所述的一种基于方面观点词情感对齐的跨领域情感分析方法,其特征在于,所述设计关系分类任务和情感对齐分类任务两个自监督任务,训练gcn自动编码器,获得包含背景常识和方面观点词情感对齐的第二特征向量,包括:预测节点与节点之间的关系获得常识知识特征向量,以及利用情感对齐二元分类任务来学习方面观点对之间的情感对齐特征,从而获得包含背景常识和方面观点词情感对齐的特征向量;其中,特征向量的转换过程可以表示为:
其中,代表节点i在关系r下的所有邻居节点;c
i,r
是可以预先设置的归一化常数;g
i
是随机初始化的初始节点特征向量,对其使用两步图卷积过程后,转换为h
i
,即为领域聚合特征向量,和是指第l层的权重矩阵;x
i
是节点i的特征向量表示,x
j
是节点j的特征向量表示。5.根据权利要求1所述的一种基于方面观点词情感对齐的跨领域情感分析方法,其特征在于,所述将gcn自动编码器产生的第二特征向量输入图特征重构器,通过图特征重构器,图节点级别特征向量向量适应词级别的向量的过程中,以句子为单位,特征映射层和图特征重构器设计如下:x
c
=w
c
x’c
+b
c
x’recon
=w
recon
x
c
+b
recon
其中,x代表句子的向量表示,w
c
和b
c
,w
recon
和b
recon
都是权重矩阵;x’c
是x构建子图谱后通过gcn自动编码器后,平均图谱中所有节点表示所获得的句子特征向量;x’recon
是进过图特征重构器后获得的适应到单词级别分布空间的句子特征向量表示;x
c
的向量表示作为gcn自动编码器对句子x的最终向量表示;b
c
是全连接层的常数向量。6.根据权利要求5所述的一种基于方面观点词情感对齐的跨领域情感分析方法,其特征在于,所述图特征重构器的损失函数的表达式如下:其中,x’c
,x’recon
分别是句子x构建子图谱后,将图谱输入gcn自动编码器后获得的句子特征向量表示,以及通过重构函数后获得的句子特征向量表示。7.根据权利要求1所述的一种基于方面观点词情感对齐的跨领域情感分析方法,其特征在于,所述拼接两个编码器产生的特征向量作为句子的向量输入情感分类器,计算输入文本所有可能极性的概率,选择概率最大的情感标签作为最终的预测情感标签,完成情感分析任务的步骤中,句子的特征向量表示为:x=[x
c
;x
w
]其中,x
c
是通过带有方面观点词情感对齐的常识知识向量,x
w
是bert编码器产生的带有上下文信息的句子向量;[;]表示拼接向量。8.根据权利要求7所述的一种基于方面观点词情感对齐的跨领域情感分析方法,其特征在于,完成情感分析任务的步骤中,输出给定句子x的情感概率,情感概率的计算公式如下:其中,c
i
∈c是可能的情感极性,x
i
是第i个节点的向量表示。9.根据权利要求1所述的一种基于方面观点词情感对齐的跨领域情感分析方法,其特征在于,所述优化跨领域情感分析模型,包括:采用adam优化器优化所述跨领域情感分析模型,其中,优化过程中采用的损失函数表
示如下:其中,表示的是句子向量表示重构的损失;表示的是情感分类任务的交叉熵损失函数。10.一种基于方面观点词情感对齐的跨领域情感分析装置,其特征在于,包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现权利要求1-9任一项所述的一种基于方面观点词情感对齐的跨领域情感分析方法。
技术总结本发明公开了一种基于方面观点词情感对齐的跨领域情感分析方法及装置,其中方法包括:构建跨领域情感分析模型,所述跨领域情感分析模型包括预训练BERT编码器、GCN自动编码器以及情感分类器;通过预训练BERT编码器获取第一特征向量,通过GCN自动编码器获取包含背景常识和方面观点词情感对齐的第二特征向量;拼接两个编码器产生的特征向量作为句子的向量输入情感分类器,计算输入文本所有可能极性的概率,选择概率最大的情感标签作为最终的预测情感标签,完成情感分析任务。本发明利用对抗训练将源领域和目标领域数据映射到同一分布空间,从而提高模型从源领域迁移到目标领域的实体预测效果,可广泛应用于自然语言处理技术领域。术领域。术领域。
技术研发人员:蔡毅 曾雨诗
受保护的技术使用者:华南理工大学
技术研发日:2022.06.13
技术公布日:2022/11/1