基于双视图超关系嵌入框架的知识图谱补全方法

专利2023-03-18  150



1.本发明属于信息技术及数据业务领域。


背景技术:

2.知识图谱是大规模语义网络知识库,采取符号化的知识表示方式,利用三元组(subject,relation,object)来描述具体的知识,并以有向图的形式对其进行表示和存储,具有语义丰富、结构友好、易于理解等优点。由于在表达人类先验知识上具有优良的特性,知识图谱近年来在自然语言处理、问答系统、推荐系统等诸多领域取得了广泛且成功的应用。然而,知识图谱通常存在链接缺失问题,这限制了知识图谱在相关下游任务中的应用。为解决该问题,知识图谱补全任务应运而生。知识图谱补全旨在根据知识图谱中已有事实推断出新的事实,从而使得知识图谱更完整。知识图谱嵌入是解决知识图谱补全问题的重要方法之一,它通过将知识图谱中的实体和关系嵌入到连续向量空间,从而在方便计算的同时保留知识图谱中的结构信息。因此,一个好的知识图谱嵌入方法对知识图谱的应用会起到很大帮助。
3.在现实世界的知识图谱中,层级关系和超关系是描述事实的两个重要关系,其结构如图2、图3所示。然而,当前并没有针对联合建模这两个关系的研究,导致超关系知识图谱嵌入方法在实际嵌入中的受到很多限制。
4.目前现存的知识图谱嵌入方法主要有分为三类,一类是单视图三元组知识图谱嵌入方法,这种传统的知识图谱嵌入方法主要在单视图上建模三元组信息;另一类是单视图超关系知识图谱嵌入方法,这种方法对传统方法进行了改进,使其能用于超关系知识图谱中。超关系知识图谱中的事实由一个主三元组(s,r,o)和其辅助的键值对(ai:vi)组成,但仍仅限于单视图情况;第三类是双视图三元组知识图谱嵌入方法,其可以联合建模视图中的层级和逻辑信息,但不能用于超关系知识图谱中。后两种方法都在某一方面对传统方法做出了改进,即使得传统方法能应用于更符合现实的超关系知识图谱中以及改进了传统方法会弱化实体之间的层级信息的问题,但这两种方法都只是解决了部分问题,导致二者在知识图谱链接预测和实体分类任务上还有待改进。
5.针对上述问题,本发明提出了一种双视图超关系知识图谱(dh-kg)嵌入结构,如图4所示,该结构通过双视图结构来联合建模知识图谱中的超关系和实体之间的层级关系,以更加全面的学习到实体之间的联系,从而更好的进行链接预测和实体分类任务。


技术实现要素:

6.本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
7.为此,本发明的第一个目的在于提出一种基于双视图超关系嵌入框架的知识图谱补全方法,用于更好的进行链接预测和实体分类任务。
8.为达上述目的,本发明第一方面实施例提出了一种基于双视图超关系嵌入框架的知识图谱补全方法,包括:
9.s101:构建基于双视图超关系知识图谱的数据集,所述数据集包括实例视图集、本体视图集以及跨视图链接集;
10.s102:将所述数据集输入dh-kg嵌入模型,其中,所述dh-kg嵌入模型包括gran编码器、跨视图链接学习网络和联合学习网络;
11.s103:通过所述gran编码器进行视图内超关系学习,通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,得到训练完成的dh-kg嵌入模型;
12.s104:通过所述训练完成的dh-kg嵌入模型进行知识图谱的链接预测和实体分类。
13.另外,根据本发明上述实施例的基于双视图超关系嵌入框架的知识图谱补全方法还可以具有以下附加的技术特征:
14.进一步地,在本发明的一个实施例中,所述构建基于双视图超关系知识图谱的数据集,包括:
15.获取超关系知识图谱数据集,将所述超关系知识图谱数据集中的实体作为实例视图实体集;
16.根据第一预设关系获取所述实例视图实体集的尾实体集作为本体视图概念集或跨视图连接集;通过第二预设关系获取所述本体视图概念集的尾实体集,并将所述本体视图概念集的尾实体集与所述本体视图概念集的并集作为本体视图实体集;
17.从实例视图中获取实例视图超关系事实集,并从所述实例视图超关系事实集中获取实例视图关系集;从本体视图中获取本体视图超关系事实集,并从所述本体视图超关系事实集中获取本体视图关系集;
18.根据所述实例视图实体集、实例视图超关系事实集、实例视图关系集构建实例视图,根据所述本体视图实体集、本体视图超关系事实集、本体视图关系集构建本体视图,根据所述实例视图、本体视图、跨视图连接集生成基于双视图超关系知识图谱的数据集。
19.进一步地,在本发明的一个实施例中,所述通过所述gran编码器进行视图内超关系学习,包括:
20.通过gran模型更新实体嵌入,利用更新后的实体嵌入进行实体或者关系预测,并计算出每个子视图内的损失。
21.进一步地,在本发明的一个实施例中,所述通过gran模型更新实体嵌入,包括:
22.通过gran模型将一个超关系事实作为一个异构图,然后使用mask学习策略构建模型输入;
23.通过gran使用边偏向的全连接注意力来学习所述异构图;
24.通过gran编码器更新所有超关系事实的实体嵌入向量;
25.其中,在l层gran编码器更新后的节点嵌入向量gran_e为:
26.x
(l)
=gran_e(x
(l-1)
),
27.其中,是第l层gran的输出结果。
28.进一步地,在本发明的一个实施例中,所述利用更新后的实体嵌入进行实体或者关系预测,并计算出每个子视图内的损失,包括:
29.取出mask位置的节点嵌入向量h,然后进行一个两层的线性变换操作,
[0030][0031]
其中,与输入的嵌入向量矩阵共享参数,而与输入的嵌入向量矩阵共享参数,而则是可自学习的参数,是对所有实体的预测得分,即在整个事实中由v个实体;
[0032]
加上标签平滑,根据p来得出预测值与标签之间的交叉熵损失:
[0033][0034]
其中,p
t
是预测出的得分向量p第个位置的值,y
t
是标签向量y第t个位置的值。
[0035]
进一步地,在本发明的一个实施例中,所述通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,包括:
[0036]
通过所述gran编码器,获取所有超关系事实中实体的节点嵌入,将所述节点嵌入输入hgnn超图学习模型;
[0037]
hgnn中从(k-1)层到第k层的消息传递过程定义如下:
[0038][0039]u(k)
=u
(k-1)
+σ(whu
(k-1)
θ
(k)
+b
(k)
),
[0040]
其中,是变换矩阵,是第k层的偏向量,σ是激活函数,是知识超图的关联矩阵,是节点的度矩阵,是超边的度矩阵,是第k层的输出。
[0041]
进一步地,在本发明的一个实施例中,所述跨视图损失,包括:
[0042]
通过映射操作将首部实体集映射到与本体视图向量空间中:
[0043][0044]
跨视图链接损失定义如下:
[0045][0046]
其中,使用二范数来计算实体和概念在同一向量空间中的距离偏差,t
′s是ts的负例,并且γ是边界参数。
[0047]
进一步地,在本发明的一个实施例中,所述通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,表示为:
[0048][0049]
进一步地,使用adam优化器来分别优化三个损失函数,其中ω区分视图内损失和
跨视图损失的学习率以实现联合学习。
[0050]
为达上述目的,本发明第二方面实施例提出了一种基于双视图超关系嵌入框架的知识图谱补全的装置,包括以下模块:
[0051]
获取模块,用于构建基于双视图超关系知识图谱的数据集,所述数据集包括实例视图集、本体视图集以及跨视图链接集;
[0052]
输入模块,用于将所述数据集输入dh-kg嵌入模型,其中,所述dh-kg嵌入模型包括gran编码器、跨视图链接学习网络和联合学习网络;
[0053]
训练模块,用于通过所述gran编码器进行视图内超关系学习,通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,得到训练完成的dh-kg嵌入模型;
[0054]
输出模块,用于通过所述训练完成的dh-kg嵌入模型进行知识图谱的链接预测和实体分类。
[0055]
进一步地,在本发明的一个实施例中,所述获取模块,还用于:
[0056]
获取超关系知识图谱数据集,将所述超关系知识图谱数据集中的实体作为实例视图实体集;
[0057]
根据第一预设关系获取所述实例视图实体集的尾实体集作为本体视图概念集或跨视图连接集;通过第二预设关系获取所述本体视图概念集的尾实体集,并将所述本体视图概念集的尾实体集与所述本体视图概念集的并集作为本体视图实体集;
[0058]
从实例视图中获取实例视图超关系事实集,并从所述实例视图超关系事实集中获取实例视图关系集;从本体视图中获取本体视图超关系事实集,并从所述本体视图超关系事实集中获取本体视图关系集;
[0059]
根据所述实例视图实体集、实例视图超关系事实集、实例视图关系集构建实例视图,根据所述本体视图实体集、本体视图超关系事实集、本体视图关系集构建本体视图,根据所述实例视图、本体视图、跨视图连接集生成基于双视图超关系知识图谱的数据集。
[0060]
本发明实施例提出的基于双视图超关系嵌入框架的知识图谱补全方法,主要优点是:(1)解决了产业知识图谱中多元关系事实的建模和推理,为产业知识图谱新型图结构打下了理论基础。(2)分层结构应用于推荐系统,分层决策,可普及到医疗、电商、金融、工业等需要多层知识决策的领域。(3)交叉视图链接预测可应用在论文打标、商品分类等节点分类任务。
附图说明
[0061]
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0062]
图1为本发明实施例所提供的一种基于双视图超关系嵌入框架的知识图谱补全方法流程示意图。
[0063]
图2为本发明实施例所提供的一种知识图谱超关系结构示意图。
[0064]
图3为本发明实施例所提供的一种知识图谱层级结构示意图。
[0065]
图4为本发明实施例所提供的一种双视图超关系知识图谱结构示意图。
[0066]
图5为本发明实施例所提供的一种dh-ge模型总体框架图。
[0067]
图6为本发明实施例所提供的一种基于双视图超关系嵌入框架的知识图谱补全装置流程示意图。
具体实施方式
[0068]
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0069]
下面参考附图描述本发明实施例的基于双视图超关系嵌入框架的知识图谱补全方法。
[0070]
图1为本发明实施例所提供的一种基于双视图超关系嵌入框架的知识图谱补全方法的流程示意图。
[0071]
如图1所示,该基于双视图超关系嵌入框架的知识图谱补全方法包括以下步骤:
[0072]
s101:构建基于双视图超关系知识图谱的数据集,数据集包括实例视图集、本体视图集以及跨视图链接集;
[0073]
s102:将数据集输入dh-kg嵌入模型,其中,dh-kg嵌入模型包括gran编码器、跨视图链接学习网络和联合学习网络;
[0074]
s103:通过gran编码器进行视图内超关系学习,通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,得到训练完成的dh-kg嵌入模型;
[0075]
s104:通过训练完成的dh-kg嵌入模型进行知识图谱的链接预测和实体分类。
[0076]
dh-kg包括两个子视图和一个跨视图链接其中,子视图之一的实例视图由一个实例实体集εi、一个实例关系集和一个实例超关系事实集:组成,其中(s,r,o)表示主三元组,表示m个辅助键值对。相似的,本体视图集由一个本体概念集一个本体关系集和一个本体超关系:组成。跨视图链接集是一个没有辅助键值对的超关系事实集,其中hs∈εi,
[0077]
超关系链接预测的目的就是去预测超关系事实中的缺失元素。缺失的元素可以是{s,o,v1,...,vm}中的实体,也可以是{r,a1,...,am}中的关系。在dh-kg中,和上的链接预测任务则分别是在实例视图和本体视图上的超关系链接预测任务。
[0078]
实体分类任务即尝试去预测与给定实体有关的概念。在dh-kg上,实体分类任务即
为预测跨关系链接中的尾概念。
[0079]
此处介绍基于dh-kg构建的jw44k-6k数据集,其是从wikidata中提取出的数据集。该数据集由44000个实例视图的实体和6000个本体视图的概念组成,其中包含着丰富的跨视图连接信息和视图内超关系事实。该数据集的构建包含如下四个步骤:
[0080]
s201:实例视图中的实体过滤。从wikidata中提取出来的wd50k超关系知识图谱数据集,包括50000个实体。首先将wd50k中的实体视为实例视图中的实体集εi。本发明将这一实体集视为头实体集,并根据“instance_of”关系在wikidata中找到对应的尾实体集t,并根据ε
i-εi∩t来更新εi,来过滤掉概念性的实体。过滤后的εi拥有44000个实体。
[0081]
s202:本体视图概念筛选。继续通过“instance_of”关系来寻找εi的尾实体集作为本体视图的概念集并将这个事实集作为跨视图连接集然后,εi的尾实体集q就通过“subclass_of”关系来寻找,并且通过来找到本体视图现存概念中更深层的概念,以此更新重复这个过程直到没有更深层的概念来更新
[0082]
s203:从两个子视图中分别提取超关系事实。从实例视图中提取超关系事实集其中所有的实体和辅助键值对都是从εi中得到的。然后,用同样的方式从本体视图中得到超关系事实集其中的所有概念和辅助键值对都是从中得到的。
[0083]
s204:数据集生成。从中分别得到关系集和并由此构建出实例视图和本体视图最终,我们得到了一个dh—kg数据集jw44k-6k,
[0084]
进一步地,在本发明的一个实施例中,构建基于双视图超关系知识图谱的数据集,包括:
[0085]
获取超关系知识图谱数据集,将超关系知识图谱数据集中的实体作为实例视图实体集;
[0086]
根据第一预设关系获取实例视图实体集的尾实体集作为本体视图概念集或跨视图连接集;通过第二预设关系获取本体视图概念集的尾实体集,并将本体视图概念集的尾实体集与本体视图概念集的并集作为本体视图实体集;
[0087]
从实例视图中获取实例视图超关系事实集,并从实例视图超关系事实集中获取实例视图关系集;从本体视图中获取本体视图超关系事实集,并从本体视图超关系事实集中获取本体视图关系集;
[0088]
根据实例视图实体集、实例视图超关系事实集、实例视图关系集构建实例视图,根据本体视图实体集、本体视图超关系事实集、本体视图关系集构建本体视图,根据实例视图、本体视图、跨视图连接集生成基于双视图超关系知识图谱的数据集。
[0089]
为了进行dh-kg上的表示学习,本发明提出了第一个dh-kg嵌入模型dhge,其总体框架如图5所示。其由一个视图内的gran编码器,利用hgnn超图学习模型的跨视图链接学习和联合学习部分组成。下面对这些部分进行详细介绍。
[0090]
为了进行视图内超关系学习,本发明使用了gran模型来更新实体嵌入,然后利用更新后的实体嵌入来预测实体或者关系,并最终计算出每个子视图内的损失。
[0091]
gran将一个超关系事实看作一个异构图,然后使用mask学习策略来构建模型输入。例如:就是一个遮盖了主体位置的训练样本。接着,gran使用边偏向的全连接注意力来学习异构图。我们随机的将视图内实体集嵌入为其中d是实体嵌入维度。在学习一批样本后,gran编码器更新所有超关系事实的实体嵌入向量。在l层gran编码器更新后的节点嵌入向量(gran_e)为:
[0092]
x
(l)
=gran_e(x
(l-1)
)
ꢀꢀ
(1)
[0093]
其中是第l层gran的输出结果。
[0094]
本发明使用l层gran编码器来分别在实例视图和本体视图中更新节点嵌入。在得到更新后的节点时,我们取出[mask]位置的节点嵌入向量h,然后进行一个两层的线性变换操作,
[0095][0096]
其中,与输入的嵌入向量矩阵共享参数,而与输入的嵌入向量矩阵共享参数,而则是可自学习的参数,是对所有实体的预测得分,即在整个事实中由v个实体。最后,再加上标签平滑,即可根据p来得出预测值与标签之间的交叉熵损失:
[0097][0098]
其中,p
t
是预测出的得分向量p第个位置的值,y
t
是标签向量y第t个位置的值。
[0099]
由此,可以分别得到实例视图中的损失和本体视图中的损失
[0100]
进一步地,在本发明的一个实施例中,通过gran编码器进行视图内超关系学习,包括:
[0101]
通过gran模型更新实体嵌入,利用更新后的实体嵌入进行实体或者关系预测,并计算出每个子视图内的损失。
[0102]
进一步地,在本发明的一个实施例中,通过gran模型更新实体嵌入,包括:
[0103]
通过gran模型将一个超关系事实作为一个异构图,然后使用mask学习策略构建模型输入;
[0104]
通过gran使用边偏向的全连接注意力来学习异构图;
[0105]
通过gran编码器更新所有超关系事实的实体嵌入向量;
[0106]
其中,在l层gran编码器更新后的节点嵌入向量gran_e为:
[0107]
x
(l)
=gran_e(x
(l-1)
),
[0108]
其中,是第l层gran的输出结果。
[0109]
进一步地,在本发明的一个实施例中,利用更新后的实体嵌入进行实体或者关系预测,并计算出每个子视图内的损失,包括:
[0110]
取出mask位置的节点嵌入向量h,然后进行一个两层的线性变换操作,
[0111][0112]
其中,与输入的嵌入向量矩阵共享参数,而与输入的嵌入向量矩阵共享参数,而则是可自学习的参数,是对所有实体的预测得分,即在整个事实中由v个实体;
[0113]
加上标签平滑,根据p来得出预测值与标签之间的交叉熵损失:
[0114][0115]
其中,p
t
是预测出的得分向量p第个位置的值,y
t
是标签向量y第t个位置的值。
[0116]
在每个子视图中使用gran编码器进行学习后,本发明使用超图领域聚合技术,以及跨视图损失来学习跨视图联系。
[0117]
由于存在二元或多元超关系事实,dh-kg的每个子视图都可以被视为一个由实体节点和节点之间的超边组成的超图为了将两个子视图中的信息串联起来,本发明首先使用hgnn来聚合超边所连接的节点信息。通过前文所介绍的gran编码器,我们已经得到了所有超关系事实中实体的节点嵌入并将其作为hgnn的输入。hgnn中从(k-1)层到第k层的消息传递过程定义如下:
[0118][0119]u(k)
=u
(k-1)
+σ(whu
(k-1)
θ
(k)
+b
(k)
)
ꢀꢀ
(5)
[0120]
其中,是变换矩阵,是第k层的偏向量。σ是激活函数。是知识超图的关联矩阵,是节点的度矩阵,是超边的度矩阵。是第k层的输出。为了更进一步的从关系变换中受益,本发明结合输入和输出的向量表示u=u
(0)
+u
(k)
来作为最终的嵌入向量。
[0121]
在对实例视图和本体视图分别使用超图领域聚合技术后,我们得到了和在跨视图连接集hs中,首部实体的嵌入向量hs存在于实例视图的嵌入向量空间中,可
以表示成并且尾部实体的嵌入向量ts存在于本体视图的嵌入向量空间中,可以表示成因此,为了使二者在同一向量空间中进行计算,本方法通过映射操作将首部实体集映射到与本体视图向量空间中:
[0122][0123]
并将跨视图链接损失定义如下:
[0124][0125]
公式中使用2范数来计算实体和概念在同一向量空间中的距离偏差,其中t
′s是ts的负例,并且γ是边界参数。
[0126]
进一步地,在本发明的一个实施例中,通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,包括:
[0127]
通过gran编码器,获取所有超关系事实中实体的节点嵌入,将节点嵌入输入hgnn超图学习模型;
[0128]
hgnn中从(k-1)层到第k层的消息传递过程定义如下:
[0129][0130]u(k)
=u
(k-1)
+σ(whu
(k-1)
θ
(k)
+b
(k)
),
[0131]
其中,是变换矩阵,是第k层的偏向量,σ是激活函数,是知识超图的关联矩阵,是节点的度矩阵,是超边的度矩阵,是第k层的输出。
[0132]
进一步地,在本发明的一个实施例中,跨视图损失,包括:
[0133]
通过映射操作将首部实体集映射到与本体视图向量空间中:
[0134][0135]
跨视图链接损失定义如下:
[0136]
[0137]
其中,使用二范数来计算实体和概念在同一向量空间中的距离偏差,t
′s是ts的负例,并且γ是边界参数。
[0138]
本发明联合了实例视图、本体视图和跨视图连接中的三个损失函数来设计出一个联合学习损失:
[0139][0140]
并且本发明使用adam优化器来分别优化三个损失函数,其中ω区分视图内损失和跨视图损失的学习率以实现联合学习。
[0141]
进一步地,在本发明的一个实施例中,通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,表示为:
[0142][0143]
进一步地,使用adam优化器来分别优化三个损失函数,其中ω区分视图内损失和跨视图损失的学习率以实现联合学习。
[0144]
本发明实施例提出的基于双视图超关系嵌入框架的知识图谱补全方法,第一方面提出了一种双视图超关系知识图谱嵌入框架,该框架通过将超关系事实分为实例视图和本体视图来分别学习超关系知识图谱中的超关系和层级关系,从而使超关系知识图谱更贴近于现实世界的情况,并更有利于知识图谱的链接预测以及实体分类任务;第二方面提出了一种双视图超关系知识图谱数据集的构建方法,使双视图超关系知识图谱框架可以运用到实际生活当中;第三方面结合gran、hgnn和联合学习的特点构造了第一个可用于dh-kg表示学习的模型dhge,该模型在dh-kg框架以及一般的知识图谱数据集上的效果都要优于当前存在的模型。
[0145]
为了实现上述实施例,本发明还提出一种基于双视图超关系嵌入框架的知识图谱补全装置。
[0146]
图6为本发明实施例提供的一种基于双视图超关系嵌入框架的知识图谱补全装置的结构示意图。
[0147]
如图6所示,该基于双视图超关系嵌入框架的知识图谱补全装置包括:获取模块100,输入模块200,训练模块300,输出模块400。其中,
[0148]
获取模块,用于构建基于双视图超关系知识图谱的数据集,数据集包括实例视图集、本体视图集以及跨视图链接集;
[0149]
输入模块,用于将数据集输入dh-kg嵌入模型,其中,dh-kg嵌入模型包括gran编码器、跨视图链接学习网络和联合学习网络;
[0150]
训练模块,用于通过gran编码器进行视图内超关系学习,通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,得到训练完成的dh-kg嵌入模型;
[0151]
输出模块,用于通过训练完成的dh-kg嵌入模型进行知识图谱的链接预测和实体分类。
[0152]
进一步地,在本发明的一个实施例中,获取模块,还用于:
[0153]
获取超关系知识图谱数据集,将超关系知识图谱数据集中的实体作为实例视图实
体集;
[0154]
根据第一预设关系获取实例视图实体集的尾实体集作为本体视图概念集或跨视图连接集;通过第二预设关系获取本体视图概念集的尾实体集,并将本体视图概念集的尾实体集与本体视图概念集的并集作为本体视图实体集;
[0155]
从实例视图中获取实例视图超关系事实集,并从实例视图超关系事实集中获取实例视图关系集;从本体视图中获取本体视图超关系事实集,并从本体视图超关系事实集中获取本体视图关系集;
[0156]
根据实例视图实体集、实例视图超关系事实集、实例视图关系集构建实例视图,根据本体视图实体集、本体视图超关系事实集、本体视图关系集构建本体视图,根据实例视图、本体视图、跨视图连接集生成基于双视图超关系知识图谱的数据集。
[0157]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0158]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0159]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征:
1.一种基于双视图超关系嵌入框架的知识图谱补全方法,其特征在于,包括以下步骤:构建基于双视图超关系知识图谱的数据集,所述数据集包括实例视图集、本体视图集以及跨视图链接集;将所述数据集输入dh-kg嵌入模型,其中,所述dh-kg嵌入模型包括gran编码器、跨视图链接学习网络和联合学习网络;通过所述gran编码器进行视图内超关系学习,通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,得到训练完成的dh-kg嵌入模型;通过所述训练完成的dh-kg嵌入模型进行知识图谱的链接预测和实体分类。2.根据权利要求1所述的方法,其特征在于,所述构建基于双视图超关系知识图谱的数据集,包括:获取超关系知识图谱数据集,将所述超关系知识图谱数据集中的实体作为实例视图实体集;根据第一预设关系获取所述实例视图实体集的尾实体集作为本体视图概念集或跨视图连接集;通过第二预设关系获取所述本体视图概念集的尾实体集,并将所述本体视图概念集的尾实体集与所述本体视图概念集的并集作为本体视图实体集;从实例视图中获取实例视图超关系事实集,并从所述实例视图超关系事实集中获取实例视图关系集;从本体视图中获取本体视图超关系事实集,并从所述本体视图超关系事实集中获取本体视图关系集;根据所述实例视图实体集、实例视图超关系事实集、实例视图关系集构建实例视图,根据所述本体视图实体集、本体视图超关系事实集、本体视图关系集构建本体视图,根据所述实例视图、本体视图、跨视图连接集生成基于双视图超关系知识图谱的数据集。3.根据权利要求1所述的方法,其特征在于,所述通过所述gran编码器进行视图内超关系学习,包括:通过gran模型更新实体嵌入,利用更新后的实体嵌入进行实体或者关系预测,并计算出每个子视图内的损失。4.根据权利要求3所述的方法,其特征在于,所述通过gran模型更新实体嵌入,包括:通过gran模型将一个超关系事实作为一个异构图,然后使用mask学习策略构建模型输入;通过gran使用边偏向的全连接注意力来学习所述异构图;通过gran编码器更新所有超关系事实的实体嵌入向量;其中,在l层gran编码器更新后的节点嵌入向量gran_e为:x
(l)
=gran e(x
(l-1)
),其中,是第l层gran的输出结果。5.根据权利要求3所述的方法,其特征在于,所述利用更新后的实体嵌入进行实体或者关系预测,并计算出每个子视图内的损失,包括:取出mask位置的节点嵌入向量h,然后进行一个两层的线性变换操作,
其中,与输入的嵌入向量矩阵共享参数,而与输入的嵌入向量矩阵共享参数,而则是可自学习的参数,是对所有实体的预测得分,即在整个事实中由v个实体;加上标签平滑,根据p来得出预测值与标签之间的交叉熵损失:其中,p
t
是预测出的得分向量p第个位置的值,y
t
是标签向量y第t个位置的值。6.根据权利要求1所述的方法,其特征在于,所述通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,包括:通过所述gran编码器,获取所有超关系事实中实体的节点嵌入,将所述节点嵌入输入hgnn超图学习模型;hgnn中从(k-1)层到第k层的消息传递过程定义如下:u
(k)
=u
(k-1)
+σ(w
h
u
(k-1)
θ
(k)
+b
(k)
),其中,是变换矩阵,是第k层的偏向量,σ是激活函数,是知识超图的关联矩阵,是节点的度矩阵,是超边的度矩阵,是第k层的输出。7.根据权利要求1或6所述的方法,其特征在于,所述跨视图损失,包括:通过映射操作将首部实体集映射到与本体视图向量空间中:跨视图链接损失定义如下:其中,使用二范数来计算实体和概念在同一向量空间中的距离偏差,t

s
是t
s
的负例,并且γ是边界参数。8.根据权利要求1所述的方法,其特征在于,所述通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,表示为:
进一步地,使用adam优化器来分别优化三个损失函数,其中ω区分视图内损失和跨视图损失的学习率以实现联合学习。9.一种基于双视图超关系嵌入框架的知识图谱补全装置,其特征在于,包括:获取模块,用于构建基于双视图超关系知识图谱的数据集,所述数据集包括实例视图集、本体视图集以及跨视图链接集;输入模块,用于将所述数据集输入dh-kg嵌入模型,其中,所述dh-kg嵌入模型包括gran编码器、跨视图链接学习网络和联合学习网络;训练模块,用于通过所述gran编码器进行视图内超关系学习,通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,得到训练完成的dh-kg嵌入模型;输出模块,用于通过所述训练完成的dh-kg嵌入模型进行知识图谱的链接预测和实体分类。10.根据根据权利要求9所述的装置,其特征在于,所述获取模块,还用于:获取超关系知识图谱数据集,将所述超关系知识图谱数据集中的实体作为实例视图实体集;根据第一预设关系获取所述实例视图实体集的尾实体集作为本体视图概念集或跨视图连接集;通过第二预设关系获取所述本体视图概念集的尾实体集,并将所述本体视图概念集的尾实体集与所述本体视图概念集的并集作为本体视图实体集;从实例视图中获取实例视图超关系事实集,并从所述实例视图超关系事实集中获取实例视图关系集;从本体视图中获取本体视图超关系事实集,并从所述本体视图超关系事实集中获取本体视图关系集;根据所述实例视图实体集、实例视图超关系事实集、实例视图关系集构建实例视图,根据所述本体视图实体集、本体视图超关系事实集、本体视图关系集构建本体视图,根据所述实例视图、本体视图、跨视图连接集生成基于双视图超关系知识图谱的数据集。

技术总结
本发明提出一种基于双视图超关系嵌入框架的知识图谱补全方法,包括,构建基于双视图超关系知识图谱的数据集,数据集包括实例视图集、本体视图集以及跨视图链接集;将数据集输入DH-KG嵌入模型,其中,DH-KG嵌入模型包括GRAN编码器、跨视图链接学习网络和联合学习网络;通过GRAN编码器进行视图内超关系学习,通过超图领域聚合技术以及跨视图损失进行跨视图联系学习,通过联合实例视图集、本体视图集和跨视图连接集分别对应的损失函数进行联合学习,得到训练完成的DH-KG嵌入模型;通过训练完成的DH-KG嵌入模型进行知识图谱的链接预测和实体分类。本发明通过双视图结构来联合建模知识图谱中的超关系和实体之间的层级关系,从而更好的进行链接预测和实体分类任务。而更好的进行链接预测和实体分类任务。而更好的进行链接预测和实体分类任务。


技术研发人员:鄂海红 罗浩然 宋美娜 谭玲 姚天宇 周庚显
受保护的技术使用者:北京邮电大学
技术研发日:2022.07.15
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-1860.html

最新回复(0)