本发明引入了一种创新的算法模型,融合上下文注意力的对比学习(contrastivelearning with context attention,clca)和cgcn(core graph convolutional network,cgcn)的行为极性分类模型。该发明专门设计用于行为极性分类任务,通过结合上下文信息和对比学习策略,以提升对复杂法律文本数据的分类准确性和效率。
背景技术:
1、判决要素抽取的另一个关键点在于行为极性分类。在法律中,行为极性通常指的是对一个行为在法律框架下的性质或价值的评价,即判断该行为是正面的(合法、正当或有利的)还是负面的(非法、不当或有害的)。这种分类基于法律规范、道德标准和社会价值观,用于指导人们的行为、评估案件事实以及制定司法判断。行为极性的确定涉及对行为本身及其产生的后果、动机、环境等多个方面的综合考量。在实际的法律实践中,由于各种复杂因素的影响,对同一行为的极性评价可能存在争议,尤其是在法律边缘地带或新出现的社会现象中。因此,法官、律师及其他法律专业人士需要依据法律、先例、原则和具体案情来进行仔细的分析和判断。
2、一个行为的极性分类标准目前来说不是很明确,地域、人为因素、司法实践等方面的差别常常导致了相似的行为可能有不同的极性判断结果。总的来说,法律文本或事件通常具有高度结构性和语义复杂性,一般的极性分类方法无法在此背景下区分不同法律条文下行为极性的差别,特别是相似但是后果不同的行为。此外由于法律文本一般来说比较长和复杂,不同行为间可能存在一定的关联,需要针对这个特性引入上下文注意力机制,让模型关注于行为相关的描述,捕捉前后相关性,更有利于行为的分类。
3、本发明的目标是对抽取出的行为进行分析,区分出在法律意义上影响判决结果的行为。面临的困难主要有以下几点:
4、1、专业术语和复杂的表达形式。具体表现为法律文本语句上有很多细致的因果关系、条款、情况等描述,包括了较多的嵌套和从句,给行为的抽取带来了较多的困难,进而影响行为极性的判断。
5、2、上下文依赖关系。法律文本中行为与上下文紧密关联,具有时序特征,往往需要结合当前行为的案件背景和上下文关系才可以对行为的极性进行合理的判断,因此需要处理复杂的上下文依赖关系和融合当前的案件背景信息。
6、3、法律文本的模糊性和抽象性。法律文本内容的解读具有一定的抽象性,不同专家对一个行为的解释存在差异,这种抽象性导致了无法对行为极性类别建立一个合适的标准,行为极性的分类依据缺乏客观标准。此外,不同案件中对行为极性的定义可能是不一致的,行为极性判断难有一个统一的标准。
7、4、长文本和有效数据缺乏。法律文本常常是长文本,包含了大量的文本描述,处理长文本要求模型具有捕获长距离文本依赖关系的能力,且可以比较高效的并行处理这些依赖关系。另一个困难问题是高质量的标准数据很难获取,数据内存在比较严重的类别不平衡问题,大量数据中的行为有同质化的问题,比如大部分离婚案件中的负面行为集中在几个高频行为上,这对模型的训练是不利的。
技术实现思路
1、为了应对法律文本中行为极性分类的挑战,本发明引入了一种创新的算法模型,融合上下文注意力的对比学习(contrastive learning with context attention,clca)和cgcn(core graph convolutional network,cgcn)的行为极性分类模型。该模型专门设计用于行为极性分类任务,通过结合上下文信息和对比学习策略,以提升对复杂法律文本数据的分类准确性和效率。本发明旨在设计一个轻量化的无卷积视觉检测网络,所采用的技术方案是:
2、步骤1:算法总体用plm模型的句子对输入方式可以让模型更多注意到与目标标签相关的描述,利用这个特点,设计出了提示词拼接原始文本的方法,引导模型去关注与当前行为相关的部分,结合本发明提出的特殊注意力机制,可以直接完成行为关键要素的词嵌入表示,词嵌入中与行为极性相关的信息得到了增强。
3、步骤2:在设计上下文注意力模块设计时,使用plm模型对输入序列做编码时往往只是基于其相关性做权重和得到新的结果,只考虑了正面的信息,忽略了负面的信息。在一些需要明确区分正面和负面信息的场合下,其词嵌入表示存在缺陷,尤其在行为极性分类问题上,行为的词嵌入表示需要融合相关的极性信息。基于这个问题,本模块提出了改进的上下文注意力,同时考虑了注意力的极性和上下文表示问题。
4、步骤3:在设计cgcn模块时,主要有2个关键工作:对行为图进行采样分割;添加随机的跳跃连接,对图进行采样的目的是减少模型在单个节点聚合时梯度的大小,当聚合节点变少时,信息压缩的问题也会得到缓解,还可以帮助模型学习行为图的子空间特征。
5、步骤4:在设计对比学习模块时,目的是作为辅助任务帮助模型区分难以判断的行为的极性。其基本原理是通过标签和行为的相似度信息,对比分析行为极性分类的输出结果,帮助模型学习行为间的相似性特征和行为极性类别的相似性信息。也提出了一种改进的策略,对批次内的嵌入表示进行dropout操作得到受到干扰的正样本,增加单个批次内的对比样本,提高本发明模型的通用性和多样性。
6、步骤5:在设计训练损失函数时,对于对比学习任务,训练的目标是让正例间距离更近,负例间距离更远,交叉熵函数不能比较好的适应于训练目标。kl散度是一种比较两个分布间相似程度的方式。
7、步骤6:将上述模块进行连接,整体模型采用步骤5中提出的损失函数,将数据集输入算法后得到结果。
1.一种基于clca-cgcn的行为极性分类算法,其特征在于包含以下步骤:
2.如权利要求1所述方法,其特征在于,步骤2中的上下文注意力模块采用特殊注意力机制,可以直接完成行为关键要素的词嵌入表示,词嵌入中与行为极性相关的信息得到了增强作为解决方案。
3.如权利要求1所述方法,其特征在于,步骤3中的模块采用了对行为图进行采样分割;添加随机的跳跃连接。
4.如权利要求1所述方法,其特征在于,步骤4中通过标签和行为的相似度信息,对比分析行为极性分类的输出结果,帮助模型学习行为间的相似性特征和行为极性类别的相似性信息。
5.如权利要求1所述方法,其特征在于,步骤5中交叉熵函数不能比较好的适应于训练目标。kl散度是一种比较两个分布间相似程度的方式。
