本申请涉及大数据,具体涉及一种知识图谱构建方法、装置和计算机可读存储介质。
背景技术:
1、随着社会经济数字化建设快速发展,诸多应用领域积累了海量有价值的数据,这些数据具有量级庞大、种类繁多、结构多元等特点,传统的计算机存储技术与数据管理方式已无法满足一些领域中的业务场景。同时,在不同的业务场景中,多源数据之间存在相互关联性较弱甚至没有构建关联关系的情况,导致很多内在的数据之间的价值信息无法被充分挖掘。
技术实现思路
1、为解决上述技术问题,本申请采用的技术方案是:提供一种知识图谱构建方法、装置和计算机可读存储介质,以至少解决相关技术中多源数据之间存在相互关联性较弱甚至没有构建关联关系的情况,导致很多内在的数据之间的价值信息无法被充分挖掘的问题。
2、根据本发明的一个实施例,提供了一种知识图谱构建方法,包括:
3、确定知识图谱数据结构;
4、在数据仓库中基于所述知识图谱数据结构对源数据进行转化和融合,得到实体数据表和关系数据表;
5、基于所述实体数据表和所述关系数据表构建知识图谱。
6、为解决上述技术问题,本申请采用的一个技术方案是:提供一种电子设备,包括存储器和处理器,其中,存储器用于存储计算机程序,计算机程序在被处理器执行时,用于实现上述技术方案中的知识图谱构建方法。
7、为解决上述技术问题,本申请采用的一个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,计算机程序在被处理器执行时,用于实现上述技术方案中的知识图谱构建方法。
8、通过上述方案,本申请的有益效果是:本申请提供的知识图谱构建方法基于在数据仓库中根据知识图谱数据结构对源数据进行转化和融合得到的实体数据表和关系数据表构建知识图谱,由于整个过程在数据仓库中实施的,由此也能够增强数据仓库对整体数据流中间过程的管理功能,有利于后续数据资产管理和数据问题定位,如此将多源异构数据进行融合关联,进而能够挖掘到更有价值的深层次数据。
1.一种知识图谱构建方法,其特征在于,包括:确定知识图谱数据结构;
2.根据权利要求1所述的知识图谱构建方法,其特征在于,所述在数据仓库中基于所述知识图谱数据结构对源数据进行处理,得到实体数据表和关系数据表,包括:
3.根据权利要求2所述的知识图谱构建方法,其特征在于,所述源数据为多源数据,所述实体数据来源信息包括数据来源字段映射;所述基于所述实体数据来源信息,并结合所述知识图谱数据结构自动化地对所述源数据进行标准转化与数据融合,得到所述实体数据表,包括:
4.根据权利要求3所述的知识图谱构建方法,其特征在于,所述利用所述实体的所述唯一标识以及所述数据来源字段映射,将所述多源数据中实体的属性与实体属性字段进行多对一映射,以对所述实体的属性数据进行提取和融合,得到所述实体数据表,包括:
5.根据权利要求1所述的知识图谱构建方法,其特征在于,所述在数据仓库中基于所述知识图谱数据结构对源数据进行转化和融合,得到实体数据表和关系数据表,包括:
6.根据权利要求5所述的知识图谱构建方法,其特征在于,所述关系包括动态关系,所述关系数据表包括动态关系数据表;所述汇总所述基本关系数据结构和属性,得到所述关系数据表,包括:
7.根据权利要求6所述的知识图谱构建方法,其特征在于,所述关系包括动态关系,所述关系数据表包括动态关系数据表;所述汇总所述基本关系数据结构和属性,得到所述关系数据表,之后包括:
8.根据权利要求7所述的知识图谱构建方法,其特征在于,所述关系包括动态关系和静态关系,所述关系数据表包括动态关系数据表和静态关系数据表,所述基于所述关系数据表,计算实体对之间的关联度,包括:
9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器,所述处理器耦接所述存储器,所述处理器被配置为基于存储在所述存储器中的指令,执行权利要求1至8任一项所述的知识图谱构建方法的一个或多个步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-8中任一项所述的知识图谱构建方法的步骤。