本发明涉及知识图谱推理领域,具体涉及一种基于图神经网络的少样本知识图谱推理方法。
背景技术:
1、知识图谱是指由现实世界中各种实体、概念和关系组成的大规模语义网络。知识图谱常以三元组的形式来表示和存储现实世界的知识,这些三元组一般由(头实体,关系,尾实体)构成。实体由现实世界的具体对象和抽象概念构成,关系则是描述不同实体之间或者概念之间的联系,这些事实之间相互连接,以此构成庞大的知识语义网络。
2、现有的知识图谱推理方法在拥有大量实体和关系信息的知识图谱上能够取得较好的推理性能,然而大多数知识图谱中关系的频率分布通常具有长尾问题,很多类型的关系仅有少量的实体对,这种关系称为少样本关系。少样本知识图谱推理旨在通过给定少样本关系以及少量实体对去预测知识图谱中缺失的未见事实,对少样本知识图谱进行推理补全。
3、近几年,针对少样本关系进行知识图谱推理的研究引起研究员们的广泛探索,并且提出多种少样本知识推理模型,如基于度量学习的模型和基于元学习器的模型。这些模型在少样本知识图谱推理中取得不错的效果,然而,这些方法仍存在忽略了实体之间的关系路径信息和实体上下文语义信息,以及关系表示学习能力不足的问题。
技术实现思路
1、本发明提供一种基于图神经网络的少样本知识图谱推理方法。该方法是针对现有少样本知识图谱推理方法存在的不足而设计的一种知识推理方法,用于充分利用少样本知识图谱中的信息,提高少样本知识图谱推理性能。本发明方法基于图神经网络,首先通过实体之间的关系路径获取关系信息,利用注意力机制区分关系路径中不同关系对于实体的重要性,聚合邻居信息生成少样本关系的头尾实体嵌入表示,然后通过利用少样本关系相关联实体对的邻居关系信息学习准确的关系表示,接下来将transformer编码器和lstm神经网络相结合,学习实体的上下文语义信息,进一步增强少样本关系表示的质量,最后得到知识推理的结果。
2、本发明提供的一种基于图神经网络的少样本知识图谱推理方法,主要包括以下步骤:
3、步骤100、知识图谱数据预处理模块;
4、步骤110、将知识图谱表示为g={e,r,f}。其中,e表示实体集合{e1,e2,e3...,ee},实体e是知识图谱中最基本的元素。r表示关系集合{r1,r2,r3...,rr},关系r表示在不同实体之间的特定连接。f表示事实集合{f1,f2,f3...,ff},是知识图谱中的三元组集合。对于事实集合f,其中每个f可以被定义为三元组(h,r,t),即(头实体,关系,尾实体),其中,h为头实体,r为关系,t为尾实体。背景知识图谱g′是从g中去除所有少样本关系后得到的知识图谱g的子图;
5、步骤120、通过transe知识图谱嵌入方法对知识图谱进行预处理,获得知识图谱中实体和关系的初始嵌入向量表示;
6、步骤130、将知识图谱g中任务关系的集合,用rtask表示。rtask分为元训练集rtrain、元验证集rvalid和元测试集rtest。测试集中的任务关系在训练集中不可见,即在训练阶段,对于每个训练任务r∈rtrain,相关的三元组被随机的分为支持集sr和查询集qr。
7、步骤200、实体邻居编码器:对于少样本关系r相关的三元组(hi,r,ti),通过实体之间的关系路径获取关系信息,利用注意力机制区分关系路径中不同关系对于实体的重要性,聚合邻居信息生成少样本关系r的头尾实体嵌入表示。
8、步骤300、关系表示编码器:利用支持集中实体的邻居关系信息,来减小少样本关系对相关联实体对的依赖,得到更准确的少样本关系表示。
9、步骤400、transformer学习器:将lstm神经网络和transformer编码器相融合,在transformer编码器之前先将实体和关系通过lstm网络处理,然后输入到transformer编码器中,得到进一步增强的少样本关系嵌入表示。
10、步骤500、匹配处理器:使用注意力机制获取支持集的动态关系表示,然后计算支持集与查询三元组的语义相似度,依据语义相似度得分对查询三元组进行排序,得到推理预测结果。
1.一种基于图神经网络的少样本知识图谱推理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于图神经网络的少样本知识图谱推理方法,其特征在于,对知识图谱进行初始化嵌入预训练并划分数据集的步骤包括:
3.根据权利要求1或2所述的基于图神经网络的少样本知识图谱推理方法,其特征在于,利用实体邻居编码器通过关系路径编码少样本关系相联的实体嵌入表示的步骤至少包括:
4.根据权利要求1~3任一项所述的基于图神经网络的少样本知识图谱推理方法,其特征在于,利用关系表示编码器学习支持集中实体的邻居关系信息的步骤至少包括:
5.根据权利要求1~4任一项所述的基于图神经网络的少样本知识图谱推理方法,其特征在于,融合lstm神经网络和transformer编码器学习实体的上下文语义信息的步骤至少包括:
6.根据权利要求1~5任一项所述的基于图神经网络的少样本知识图谱推理方法,其特征在于,使用注意力机制获取支持集的动态关系表示,计算语义相似度并依据查询三元组的匹配相似度得分进行排序的步骤至少包括: