知识图谱更新方法、装置、电子设备及存储介质与流程

专利检索2025-01-13  41


本发明涉及人工智能和知识管理,尤其涉及一种知识图谱更新方法、装置、电子设备及存储介质。


背景技术:

1、知识图谱作为一种结构化的知识表示方式,能够将复杂的数据和信息转化为易于理解和操作的形式。通过实体、属性和关系的图结构来表示和组织知识,为数据分析和决策支持提供了强大的工具。但知识图谱通常难以构建和更新维护,手动更新方法能够保证数据的高度准确性和可靠性,但效率极低,难以应对大数据量和快速更新的需求,高度依赖专业知识,成本高昂。半自动化更新方法结合自动化技术和人工审核,相对人工方法提高了效率,在一定程度上保持了数据的准确性和可靠性,但仍面临效率不足和对专业知识依赖度高的问题。基于规则的自动更新方法通过预定义的规则实现自动化更新,提高了大规模数据处理的能力,但规则的制定需要丰富的专业知识,难以涵盖所有情形,对复杂和多变的数据环境适应性较差。基于机器学习的方法通过从历史数据中自动学习和适应新模式,提供了处理复杂和多样化数据的可能性,然而这种方法需要大量训练数据来构建有效模型,并可能在数据质量参差不齐的情况下遭遇准确性问题。


技术实现思路

1、本发明提供一种知识图谱更新方法、装置、电子设备及存储介质,用以解决现有的领域知识图谱更新方法存在一系列局限性的缺陷。

2、本发明提供一种知识图谱更新方法,包括:

3、从待更新知识图谱对应的目标领域数据源中获取目标领域数据;

4、基于预先调整的大型语言模型从所述目标领域数据中抽取目标领域知识;

5、确定所述目标领域知识和所述待更新知识图谱的现有知识之间的知识冲突;

6、根据所述知识冲突对所述目标领域知识进行冲突消解,将冲突消解后的所述目标领域知识整合至所述现有知识,完成知识图谱更新。

7、根据本发明提供的一种知识图谱更新方法,所述确定所述目标领域知识和所述待更新知识图谱的现有知识之间的知识冲突,包括:

8、基于生成式语言模型的预设指令模板确定所述目标领域知识和所述待更新知识图谱的现有知识之间的知识冲突,所述知识冲突包括属性冗余、属性冲突、关系冗余和关系冲突。

9、根据本发明提供的一种知识图谱更新方法,所述根据所述知识冲突对所述目标领域知识进行冲突消解,包括:

10、若所述知识冲突对应的所述目标领域知识的属性与所述现有知识的属性之间的相似度大于属性相似度阈值,随机抽取所述目标领域知识进行冲突消解,否则将所述目标领域知识加入属性冲突消解候选集;

11、若所述知识冲突对应的所述目标领域知识的关系与所述现有知识的关系之间的相似度大于关系相似度阈值,随机抽取所述目标领域知识进行冲突消解,否则将所述目标领域知识加入关系冲突消解候选集。

12、根据本发明提供的一种知识图谱更新方法,还包括:

13、基于预设专家标注和预设冲突消解规则中的至少一个对所述属性冲突消解候选集或所述关系冲突消解候选集进行选择消解。

14、根据本发明提供的一种知识图谱更新方法,所述将冲突消解后的所述目标领域知识整合至所述现有知识,包括:

15、根据预设权重对冲突消解后的所述目标领域知识进行加权评分,得到目标领域知识评分;

16、根据所述目标领域知识评分优先级将所述目标领域知识整合至所述现有知识。

17、根据本发明提供的一种知识图谱更新方法,所述从待更新知识图谱对应的目标领域数据源中获取目标领域数据,包括:

18、从待更新知识图谱对应的目标领域数据源中获取多源实时数据;

19、对所述多源实时数据进行清洗、去噪和标准化处理,得到所述目标领域数据。

20、根据本发明提供的一种知识图谱更新方法,还包括:

21、基于预设评估指标对更新后的所述知识图谱进行评估,基于评估结果对所述知识图谱进行调整和优化。

22、本发明还提供一种知识图谱更新装置,包括:

23、获取模块,用于从待更新知识图谱对应的目标领域数据源中获取目标领域数据;

24、抽取模块,用于基于预先调整的大型语言模型从所述目标领域数据中抽取目标领域知识;

25、确定模块,用于确定所述目标领域知识和所述待更新知识图谱的现有知识之间的知识冲突;

26、更新模块,用于根据所述知识冲突对所述目标领域知识进行冲突消解,将冲突消解后的所述目标领域知识整合至所述现有知识,完成知识图谱更新。

27、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述知识图谱更新方法。

28、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述知识图谱更新方法。

29、本发明提供的知识图谱更新方法、装置、电子设备及存储介质,从待更新知识图谱对应的目标领域数据源中获取目标领域数据;基于预先调整的大型语言模型从所述目标领域数据中抽取目标领域知识;确定所述目标领域知识和所述待更新知识图谱的现有知识之间的知识冲突;根据所述知识冲突对所述目标领域知识进行冲突消解,将冲突消解后的所述目标领域知识整合至所述现有知识,完成知识图谱更新。本发明自动从目标领域数据源中获取目标领域数据,大幅减少了人工干预的需求,同时提高了知识图谱的时效性和准确性。设置大型语言模型抽取目标领域知识,能够理解和处理大量的自然语言数据,对复杂和多变的数据环境适应性较好。大型语言模型的训练样本十分充足,模型的准确性更高。



技术特征:

1.一种知识图谱更新方法,其特征在于,包括:

2.根据权利要求1所述的知识图谱更新方法,其特征在于,所述确定所述目标领域知识和所述待更新知识图谱的现有知识之间的知识冲突,包括:

3.根据权利要求2所述的知识图谱更新方法,其特征在于,所述根据所述知识冲突对所述目标领域知识进行冲突消解,包括:

4.根据权利要求3所述的知识图谱更新方法,其特征在于,还包括:

5.根据权利要求3所述的知识图谱更新方法,其特征在于,所述将冲突消解后的所述目标领域知识整合至所述现有知识,包括:

6.根据权利要求1所述的知识图谱更新方法,其特征在于,所述从待更新知识图谱对应的目标领域数据源中获取目标领域数据,包括:

7.根据权利要求1所述的知识图谱更新方法,其特征在于,还包括:

8.一种知识图谱更新装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述知识图谱更新方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述知识图谱更新方法。


技术总结
本发明提供一种知识图谱更新方法、装置、电子设备及存储介质,属于人工智能和知识管理技术领域,方法包括获取目标领域数据;基于预先调整的大型语言模型从目标领域数据中抽取目标领域知识;确定目标领域知识和待更新知识图谱的现有知识之间的知识冲突;根据知识冲突对目标领域知识进行冲突消解,将冲突消解后的目标领域知识整合至现有知识,完成知识图谱更新。本发明自动从目标领域数据源中获取目标领域数据,大幅减少了人工干预的需求,同时提高了知识图谱的时效性和准确性。设置大型语言模型抽取目标领域知识,能够理解和处理大量的自然语言数据,对复杂和多变的数据环境适应性较好。大型语言模型的训练样本十分充足,模型的准确性更高。

技术研发人员:何伟,金鑫,谢水庚,刘璐,郝志强
受保护的技术使用者:北京航天云路有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1148614.html

最新回复(0)