本申请涉及计算机领域,尤其涉及一种短文本实体情感分析的方法及设备。
背景技术:
1、在自然语言处理(nlp)中,情感分析是一个重要的研究方向,它旨在识别和分类文本中的情感倾向。而短文本实体情感分析则进一步细化,专注于识别文本中特定实体的情感倾向,这对于理解用户对特定对象的态度和情感反应至关重要。例如,在产品评论中分析用户对某个功能或组件的情感态度,或者在社交媒体帖子中分析公众对某个事件或人物的情感反应。现有的短文本实体情感分析方法大多基于传统的机器学习算法和一些初步的深度学习方法。这些方法在处理长文本时表现尚可,但在短文本上往往效果不佳,因为短文本中的实体和情感表达往往更加微妙和隐晦,且实体的上下文信息不足,使得准确识别和分析情感变得更加困难。
2、现有方法中,是利用规则结合深度学习bert进行短文本实体分析,但是这种方法具有以下缺点:
3、1)实体识别不准确,短文本中的实体可能由于上下文信息不足而难以准确识别;
4、2)情感分析粒度不足,往往只能分析文本的整体情感,难以精确到特定实体的情感分析;
5、3)上下文理解不足,短文本的上下文信息有限,导致现有方法难以充分理解实体的情境和情感背景;
6、4)模型泛化能力有限,现有模型在不同领域和数据集上的泛化能力有限,难以适应多样化的短文本情感分析需求。
技术实现思路
1、本申请的一个目的是提供一种短文本实体情感分析的方法及设备,解决现有技术中实体识别不准确、情感分析粒度和上下文理解不足、模型泛化能力有限的问题。
2、根据本申请的一个方面,提供了一种短文本实体情感分析的方法,该方法包括:
3、使用第一prompt结合大语言模型对原始短文本进行实体提取,得到短文本实体;
4、将短文本实体与原始短文本结合在知识库中进行检索,得到检索文本;
5、将原始短文本、检索文本、短文本实体与第二prompt一起输入到大语言模型中,进行情感分析,得到实体情感分析结果。
6、可选地,使用第一prompt结合大语言模型对原始短文本进行实体提取,包括:
7、将原始短文本与第一prompt一起输入到大语言模型中;
8、通过第一prompt引导大语言模型关注原始短文本中的实体部分,提取出短文本实体,其中,所述第一prompt为针对实体识别的prompt。
9、可选地,将短文本实体与原始短文本结合在知识库中进行检索,得到检索文本,包括:
10、将短文本实体与原始短文本进行结合,得到结合后的实体信息;
11、构建一个查询,将结合后的实体信息作为检索条件发送到知识库中;
12、在知识库中根据检索条件检索出与所述原始短文本相似的文本或案例,得到检索文本。
13、可选地,将原始短文本、检索文本、短文本实体与第二prompt一起输入到大语言模型中,包括:
14、将原始短文本、检索文本及短文本实体进行结合,得到结合信息;
15、将结合信息与第二prompt一起输入到大语言模型中,通过第二prompt引导大语言模型关注结合信息中的情感表达,其中,所述第二prompt为针对情感分析的prompt。
16、可选地,进行情感分析,得到实体情感分析结果,包括:
17、进行实体的情感特征提取,对提取到的情感特征进行情感倾向判定;
18、结合知识库中的上下文信息对判定的情感倾向进行调整;
19、根据调整结果生成对每个实体的情感分析报告。
20、可选地,所述方法包括:
21、基于lora对已有的大语言模型的输入进行改进,使用改进后的大语言模型结合第一prompt以及结合第二prompt。
22、可选地,基于lora对已有的大语言模型的输入进行改进,包括:
23、使用lora冻结已有的大语言模型的主体参数;
24、在被冻结的大语言模型的特定层或所有层中注入可训练的低秩矩阵,进行调整被冻结的大语言模型的权重;
25、调整被冻结的大语言模型中实体情感分析任务。
26、可选地,得到实体情感分析结果之后,包括:
27、将得到的实体情感分析结果更新到知识库中。
28、根据本申请又一个方面,还提供了一种短文本实体情感分析的设备,所述设备包括:
29、一个或多个处理器;以及
30、存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述所述方法的操作。
31、根据本申请再一个方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如前述所述的方法。
32、与现有技术相比,本申请通过使用第一prompt结合大语言模型对原始短文本进行实体提取,得到短文本实体;将短文本实体与原始短文本结合在知识库中进行检索,得到检索文本;将原始短文本、检索文本、短文本实体与第二prompt一起输入到大语言模型中,进行情感分析,得到实体情感分析结果。从而提高了模型的泛化能力,使其能够适应不同领域和数据集的情感分析需求;通过将抽取到的实体与知识库中的信息相结合,可以更准确地理解实体的情境和情感背景,从而提高情感分析的粒度;可以更准确得分析特定实体的情感。
1.一种短文本实体情感分析的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,使用第一prompt结合大语言模型对原始短文本进行实体提取,包括:
3.根据权利要求1所述的方法,其特征在于,将短文本实体与原始短文本结合在知识库中进行检索,得到检索文本,包括:
4.根据权利要求1所述的方法,其特征在于,将原始短文本、检索文本、短文本实体与第二prompt一起输入到大语言模型中,包括:
5.根据权利要求4所述的方法,其特征在于,进行情感分析,得到实体情感分析结果,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法包括:
7.根据权利要求6所述的方法,其特征在于,基于lora对已有的大语言模型的输入进行改进,包括:
8.根据权利要求1所述的方法,其特征在于,得到实体情感分析结果之后,包括:
9.一种短文本实体情感分析的设备,其特征在于,所述设备包括:
10.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至8中任一项所述的方法。