本发明属于自然语言处理知识图谱,具体为融合邻居信息的超关系知识图谱补全系统和方法。
背景技术:
1、知识图谱是用于描述现实世界中各种实体、概念及关系的一种语义网络,可以理解为由实体、属性、关系等元素构成的大型知识库。而现有的知识库中不可避免的则是信息的缺失。因此知识图谱补全成为一个重要的研究方向。现有的研究可大致分为四类:第一类是将知识图表现为三元组的形式,通常把一个图表示为g=(h,r,t),其中h,t为一个事实中的头实体与尾实体,而r是连接这两个实体之间的关系,典型模型有transe,distmult。第二类为带有神经网络的知识图谱补全方法,由于神经网络的兴起,研究者们将神经网络添加到传统的知识图谱补全中,典型的模型有conve,rotate。第三类是为了解决三元组形式的知识图谱补全方法不能有效的表达现实世界中的信息,因此将原有的三元组扩展到带有时间戳的四元组的形式的时序知识图谱补全方法,典型模型有transe-tae-ilp,hyte。第四类则是超关系知识图谱补全算法,它皆是在处理之前模型不能全面的表达现实世界中错综复杂的信息。它是由若干超关系事实所构成的,而一个超关系事实由一个主三元组(h,r,t)和若干限定符(qri,qre)组成。
2、然而由于超关系知识图谱是从之前的二元关系拓展到n元关系,使得超关系内部存在着较为复杂的信息,也使得超关系内部存在着基于超图的图表示与基于语义的序列表示。然而在超关系的图表示中会存在着不同的图表示,例如局部图表示与异质图表示。显然只单单处理一种图表示或只处理超关系内部的其中一种表示不足以对超关系的复杂结构进行表示。
技术实现思路
1、本发明需要且能够解决的技术问题:
2、本发明旨在解决先前技术无法有效的处理超关系内部双重表示的问题,提出了一个融合双重表示的超关系知识图谱补全系统和方法。同时为了可以更有效的处理基于超图的图表示,融合了两种图神经网络以此能够同时处理局部的图表示和异质图表示,使得本发明可以有效的学习超关系中复杂、多样的事实。
3、本发明具体技术方案:
4、一种融合双重表示的超关系知识图谱补全系统,根据超关系知识图谱数据构建超图,包括三个模块:
5、模块一:局部图表示层,由所构建的超图处理超图中局部图表示,构建以局部图表示的局部特征序列;
6、模块二:异质图表示层,由所构建的超图处理超图中异质图表示,构建以异质图表示的异质特征序列;
7、模块三:基于语义序列的transformer层,由上述两个模块所构建的两种图表示进行整合,构建出拥有局部特征表示和异质特征表示的增强语义序列,使用本模块捕获此序列,对其进行更新,以构建更全面,具体的语义序列;
8、综合上述模块最终得到全面、丰富的语义表示,对此语义表示中每一个元素进使用[mask]标签进行遮掩,以此来预测被遮掩部分;
9、最终得出预测结果进行排序,使用链接预测常用的评价指标平均倒数排名mrr、排名小于等于1的平均占比hits@1、排名小于等于5的平均占比hits@5和排名小于等于10的平均占比hits@10作为评价指标。
10、进一步的,针对模块一,使用图注意力网络gatv2首先捕获局部特征实体,将其与关系嵌入相结合得出局部特征表示。
11、进一步的,针对模块二,使用异构图神经网络hgnn捕获异质特征实体,将其与关系相结合得出异质特征表示。
12、进一步的,针对构建增强后的语义序列表示,将局部图表示序列与异质图表示序列相拼接,以此获得更全面、丰富的语义序列表示。
13、进一步的,针对最终预测使用mlp来预测遮掩结果。
14、本发明还包括一种融合双重表示的超关系知识图谱补全方法,步骤如下:
15、步骤1:对数据集进行处理,整合出实体嵌入与关系嵌入,同时为捕获超关系内部的基于超图的图表示,构建超图;
16、步骤2:捕获超关系图表示中的局部表示;
17、步骤3:捕获超关系图表示中的异质图表示;
18、步骤4:将两种图表示相结合得到增强的语义序列,以此来捕获超关系内部的基于语义的序列表示;
19、步骤5:对捕获后的语义序列表示中的元素依次进行遮掩,以此来得到预测结果;
20、进一步的,针对步骤1,首先基于当前流行的超关系知识图谱数据集构建超图,其中超图是由若干个超边组成的图结构,而超边表示不同实体之间的连接关系。因此为了构建超边首先将实体与关系进行提取,并为其进行初始嵌入形成一个拥有所有实体与关系的词典。然后根据所构建的词典得出每一个超关系事实的特征序列,每一个特征序列则看作为一个超边;
21、进一步的,针对步骤2,为了捕获超关系图表示中的局部表示,构建了一个局部图表示层。首先将实体嵌入连同超边嵌入一同馈送到本层中以此对实体嵌入进行更新,并与关系嵌入相结合得到一个局部图表示的一个序列;
22、进一步的,针对步骤3,为了捕获超关系图表示中的异质图表示,构建了一个异质图表示层,同样的将实体嵌入连同超边嵌入一同馈送到本层的异质图表示层中,以此来更新实体嵌入,同样的与关系嵌入相结合,在这里得到一个异质图表示的一个序列;
23、进一步的,针对步骤4,将上两步骤中的两种图表进行融合后得到一个增强后的语义序列表示,然后将其馈送到本发明所构建的一个基于语义序列的transformer层中以捕获超关系内部的基于语义的序列表示;
24、进一步的,针对步骤5,将从步骤4中得到一个更新后的语义序列,将其每一个元素用[mask]来进行遮掩,然后放入到一个mlp中得到最终的预测,最后对预测的实体与关系进行一个排序,并且使用平均倒数排名mrr、排名小于等于1的平均占比hits@1、排名小于等于5的平均占比hits@5和排名小于等于10的平均占比hits@10作为评价指标。
25、本发明的有益效果:
26、与现有技术相比,本发明所述的融合双重表示的超关系知识图谱补全系统和方法解决先前技术无法有效处理超关系内部双重表示的问题,同时为了可以更有效的处理基于超图的图表示,融合了两种图神经网络以此能够同时处理局部的图表示和异质图表示,使得本发明可以有效的学习超关系中复杂、多样的事实;本发明融合双重表示下的超关系知识图谱补全方法在知识图谱补全的实际应用中表现良好,对实体软标签策略具有一定的鲁棒性;本发明可以精准的解决超关系知识图谱补全任务。
1.一种融合双重表示的超关系知识图谱补全系统,其特征在于,根据超关系知识图谱数据构建超图,包括三个模块:
2.基于权利要求1所述的融合双重表示的超关系知识图谱补全系统,其特征在于,针对模块一,使用图注意力网络gatv2首先捕获局部特征实体,将其与关系嵌入相结合得出局部特征表示。
3.基于权利要求1所述的融合双重表示的超关系知识图谱补全系统,其特征在于,针对模块二,使用异构图神经网络hgnn捕获异质特征实体,将其与关系相结合得出异质特征表示。
4.基于权利要求1所述的融合双重表示的超关系知识图谱补全系统,其特征在于,针对构建增强后的语义序列表示,将局部图表示序列与异质图表示序列相拼接,以此获得更全面、丰富的语义序列表示。
5.基于权利要求1所述的融合双重表示的超关系知识图谱补全系统,其特征在于,针对最终预测使用mlp来预测遮掩结果。
6.一种融合双重表示的超关系知识图谱补全方法,其特征在于,步骤如下:
7.基于权利要求6所述的融合双重表示的超关系知识图谱补全方法,其特征在于,针对步骤s1,首先基于当前超关系知识图谱数据集构建超图,其中超图是由若干个超边组成的图结构,而超边表示不同实体之间的连接关系;首先将实体与关系进行提取,并为其进行初始嵌入形成一个拥有所有实体与关系的词典;然后根据所构建的词典得出每一个超关系事实的特征序列,每一个特征序列则看作为一个超边。
8.基于权利要求6所述的融合双重表示的超关系知识图谱补全方法,其特征在于,针对步骤s2,构建一个局部图表示层:首先将实体嵌入连同超边嵌入一同馈送到本层中以此对实体嵌入进行更新,并与关系嵌入相结合得到一个局部图表示的一个序列。
9.基于权利要求6所述的融合双重表示的超关系知识图谱补全方法,其特征在于,针对步骤s3为了捕获超关系图表示中的异质图表示,构建一个异质图表示层:同样的将实体嵌入连同超边嵌入一同馈送到本层的异质图表示层中,以此来更新实体嵌入,同样的与关系嵌入相结合,得到一个异质图表示的一个序列。
10.基于权利要求6所述的融合双重表示的超关系知识图谱补全方法,其特征在于,针对步骤s4,将上两步骤中的两种图表进行融合后得到一个增强后的语义序列表示,然后将其馈送到本发明所构建的一个基于语义序列的transformer层中以捕获超关系内部的基于语义的序列表示;针对步骤s5,将从步骤s4中得到一个更新后的语义序列,将其每一个元素用[mask]来进行遮掩,然后放入到一个mlp中得到最终的预测,最后对预测的实体与关系进行一个排序,并且使用平均倒数排名mrr、排名小于等于1的平均占比hits@1、排名小于等于5的平均占比hits@5和排名小于等于10的平均占比hits@10作为评价指标。