本技术涉及人工智能,尤其涉及一种结合云计算的ai知识库生成方法及系统。
背景技术:
1、随着人工智能和大数据技术的飞速发展,知识库的构建和管理已成为企业和组织实现知识管理和应用的重要手段。传统的知识库构建方法往往依赖于人工整理和分类,不仅效率低下,而且难以应对大规模、多样化的知识需求。因此,如何实现自动化、智能化的知识库构建和管理已成为当前亟待解决的问题。
2、近年来,基于深度学习和自然语言处理技术的知识抽取方法取得了显著进展。这些方法能够从非结构化文本中自动抽取实体、关系等关键信息,为知识库的构建提供了有力支持。然而,现有的知识抽取方法在处理会话文本等复杂数据源时仍面临诸多挑战,如语义理解的准确性、知识表示的完整性以及知识推理的灵活性等。
技术实现思路
1、为了改善上述问题,本技术提供了一种结合云计算的ai知识库生成方法及系统。
2、第一方面,本技术实施例提供一种结合云计算的ai知识库生成方法,应用于ai知识库生成系统,所述ai知识库生成系统调用深度结构化语义网络进行ai知识库生成,所述深度结构化语义网络包括知识语义集成分支、知识衍生分支、语义复述分支和知识语义优化分支;所述方法包括:
3、对于拟进行知识库生成的第一会话文本数据源,挖掘所述第一会话文本数据源的x个层阶的会话文本语义向量,x为大于1的整数;
4、利用所述知识语义集成分支对所述x个层阶的会话文本语义向量进行集成,得到会话语义集成向量;
5、利用所述知识衍生分支对所述会话语义集成向量进行知识衍生,得到所述x个层阶的会话语义衍生向量;
6、利用所述语义复述分支对所述x个层阶的会话语义衍生向量进行语义复述,得到所述x个层阶的会话语义复述向量,其中,所述语义复述为语义总结或语义细化;
7、利用所述知识语义优化分支基于所述x个层阶的会话语义复述向量,得到所述x个层阶的会话语义优化向量;
8、基于所述x个层阶的会话语义优化向量和所述x个层阶的会话文本语义向量,确定所述第一会话文本数据源的知识库要素关系谱。
9、在一些技术方案中,所述利用所述知识语义优化分支基于所述x个层阶的会话语义复述向量,得到所述x个层阶的会话语义优化向量,包括:
10、对于所述x个层阶中的第u个层阶,利用所述知识语义优化分支基于所述第u个层阶的会话语义复述向量和所述第u个层阶原始的语义知识调整变量,得到所述第u个层阶的会话语义优化向量,u为不大于x的正整数;
11、其中,当u等于1时,所述第u个层阶原始的语义知识调整变量为设定的基准线性变量,当u大于1时,所述第u个层阶原始的语义知识调整变量为第u-1个层阶的会话语义优化向量。
12、在一些技术方案中,所述知识语义优化分支包括y个知识语义优化节点,y为正整数;
13、所述利用所述知识语义优化分支基于所述第u个层阶的会话语义复述向量和所述第u个层阶原始的语义知识调整变量,得到所述第u个层阶的会话语义优化向量,包括:
14、对于所述y个知识语义优化节点中的第v个知识语义优化节点,利用所述第v个知识语义优化节点,对所述第v个知识语义优化节点的传入信息进行处理,得到所述第v个知识语义优化节点生成的语义知识调整变量,v为不大于y的正整数,其中,当v等于1时,所述第v个知识语义优化节点的传入信息包括所述第u个层阶的会话语义复述向量和所述第u个层阶原始的语义知识调整变量,当v大于1时,所述第v个知识语义优化节点的传入信息包括所述第u个层阶的会话语义复述向量和第v-1个知识语义优化节点生成的语义知识调整变量;
15、将所述y个知识语义优化节点中的第y个知识语义优化节点生成的语义知识调整变量,确定为所述第u个层阶的会话语义优化向量。
16、在一些技术方案中,所述利用所述第v个知识语义优化节点,对所述第v个知识语义优化节点的传入信息进行处理,得到所述第v个知识语义优化节点生成的语义知识调整变量,包括:
17、利用所述第v个知识语义优化节点,对所述第u个层阶的会话语义复述向量进行两类相异的特征映射,得到第二语义知识映射向量和第三语义知识映射向量;
18、将所述第v个知识语义优化节点的传入信息中包括的所述语义知识调整变量的各个特征值,与所述语义知识调整变量的各个特征值的平均值进行求差,得到第四语义知识映射向量;
19、将所述第二语义知识映射向量与所述第四语义知识映射向量中对应分布标签的特征值进行求积,得到第五语义知识映射向量;
20、将所述第五语义知识映射向量除以所述语义知识调整变量的各个特征值的变异度,得到第六语义知识映射向量;
21、将所述第六语义知识映射向量与所述第三语义知识映射向量中对应分布标签的特征值进行求和,得到所述第v个知识语义优化节点生成的语义知识调整变量。
22、在一些技术方案中,所述基于所述x个层阶的会话语义优化向量和所述x个层阶的会话文本语义向量,确定所述第一会话文本数据源的知识库要素关系谱,包括:
23、对于所述x个层阶中的第u个层阶,基于所述第u个层阶的会话语义优化向量与所述第u个层阶的会话文本语义向量中对应分布标签特征值之间的区别权重,得到所述第u个层阶的会话文本区别数据源,其中,所述第u个层阶的会话文本区别数据源中每一个单位文本的取值,为所述第u个层阶的会话语义优化向量与所述第u个层阶的会话文本语义向量中一组对应分布标签特征值之间的区别权重,u为不大于x的正整数;
24、将所述x个层阶的会话文本区别数据源更新为所述第一会话文本数据源的层阶,得到x个相同层阶的会话文本区别数据源;
25、对所述x个相同层阶的会话文本区别数据源进行集成处理,得到目标会话文本区别数据源;
26、依据所述目标会话文本区别数据源,确定所述第一会话文本数据源的知识库要素关系谱。
27、在一些技术方案中,所述对所述x个相同层阶的会话文本区别数据源进行集成处理,得到目标会话文本区别数据源,包括:
28、将所述x个相同层阶的会话文本区别数据源中对应分布标签特征值进行求和,得到所述目标会话文本区别数据源;
29、亦或,将所述x个相同层阶的会话文本区别数据源中对应分布标签的特征值进行平均化,得到所述目标会话文本区别数据源。
30、在一些技术方案中,所述依据所述目标会话文本区别数据源,确定所述第一会话文本数据源的知识库要素关系谱,包括:
31、如果所述目标会话文本区别数据源中存在关键单位文本,则确定所述第一会话文本数据源为主干会话文本数据源,所述关键单位文本为词向量特征值属于特征值区间的单位文本;
32、依据所述关键单位文本,确定所述第一会话文本数据源对应的主干知识树。
33、在一些技术方案中,所述利用所述知识语义集成分支对所述x个层阶的会话文本语义向量进行集成,得到会话语义集成向量,包括:
34、利用所述知识语义集成分支将所述x个层阶的会话文本语义向量更新为相同层阶的会话文本语义向量,得到x个相同层阶的会话文本语义向量;
35、将所述x个相同层阶的会话文本语义向量进行基于描述维度的集成,得到所述会话语义集成向量。
36、在一些技术方案中,所述将所述x个相同层阶的会话文本语义向量进行基于描述维度的集成,得到所述会话语义集成向量之后,还包括:
37、通过最少一个残差连接子模型对所述会话语义集成向量进行向量映射,得到映射后的会话语义集成向量,其中,所述映射后的会话语义集成向量与所述会话语义集成向量具有相同的层阶和描述维度数,且所述映射后的会话语义集成向量与所述会话语义集成向量具有不同的特征值输出,所述映射后的会话语义集成向量用于进行知识衍生得到所述x个层阶的会话语义衍生向量。
38、在一些技术方案中,所述知识衍生分支包括x个知识衍生节点;所述利用所述知识衍生分支对所述会话语义集成向量进行知识衍生,得到所述x个层阶的会话语义衍生向量,包括:
39、对于所述x个知识衍生节点中的第u个知识衍生节点,利用所述第u个知识衍生节点,对所述第u个知识衍生节点的传入信息进行知识衍生,得到所述第u个知识衍生节点生成的会话语义衍生向量,u为不大于x的正整数,其中,当u等于1时,所述第u个知识衍生节点的传入信息为所述会话语义集成向量,当u大于1时,所述第u个知识衍生节点的传入信息为第u-1个知识衍生节点生成的会话语义衍生向量;
40、将所述x个知识衍生节点生成的会话语义衍生向量,确定为所述x个层阶的会话语义衍生向量。
41、在一些技术方案中,所述第u个知识衍生节点包括一个知识衍生窗口滤波子节点和最少一个非衍生窗口滤波子节点;所述利用所述第u个知识衍生节点,对所述第u个知识衍生节点的传入信息进行知识衍生,得到所述第u个知识衍生节点生成的会话语义衍生向量,包括:
42、利用所述知识衍生窗口滤波子节点对所述第u个知识衍生节点的传入信息进行知识衍生,得到第一语义知识映射向量;
43、利用所述最少一个非衍生窗口滤波子节点对所述第一语义知识映射向量进行窗口滤波,得到所述第u个知识衍生节点生成的会话语义衍生向量。
44、在一些技术方案中,所述利用所述语义复述分支对所述x个层阶的会话语义衍生向量进行语义复述,得到所述x个层阶的会话语义复述向量,包括:对于所述x个层阶中的第u个层阶,利用所述语义复述分支对所述第u个层阶的会话语义衍生向量进行描述维度的窗口滤波,得到所述第u个层阶的会话语义复述向量,其中,所述描述维度的窗口滤波用于实现所述语义总结或语义细化,u为不大于x的正整数。
45、在一些技术方案中,所述深度结构化语义网络的调试方法包括:
46、获取用于调试所述深度结构化语义网络的会话文本数据源调试样例,所述会话文本数据源调试样例不具有主干知识树;
47、挖掘所述会话文本数据源调试样例的x个层阶的会话文本语义向量,x为大于1的整数;
48、利用所述知识语义集成分支对所述x个层阶的会话文本语义向量进行集成,得到会话语义集成向量;
49、利用所述知识衍生分支对所述会话语义集成向量进行知识衍生,得到所述x个层阶的会话语义衍生向量;
50、利用所述语义复述分支对所述x个层阶的会话语义衍生向量进行语义复述,得到所述x个层阶的会话语义复述向量,其中,所述语义复述为语义总结或语义细化;
51、利用所述知识语义优化分支基于所述x个层阶的会话语义复述向量,得到所述x个层阶的会话语义优化向量;
52、朝着收敛所述x个层阶的会话语义优化向量和所述x个层阶的会话文本语义向量之间的区别权重的方向,对所述深度结构化语义网络的网络参量进行改进,得到调试后的深度结构化语义网络;所述网络参量包括模型权重和偏置参数。
53、第二方面,本技术实施例提供一种ai知识库生成系统,包括至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行第一方面所述的方法。
54、第三方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时实现第一方面所述的方法。
55、本技术提出了一种基于人工智能的知识库生成系统。该系统通过挖掘会话文本数据源的多个层阶的语义向量,实现了对文本深层语义的准确捕捉。进一步地,通过知识语义集成分支、知识衍生分支、语义复述分支以及知识语义优化分支的协同作用,该系统能够自动生成高质量的知识库要素关系谱。这不仅大大提高了知识库构建的自动化程度,还为后续的知识查询、推理和应用提供了坚实基础。
56、具体而言,本技术的知识库生成系统首先利用先进的自然语言处理技术对会话文本数据源进行深度解析,挖掘出多个层阶的会话文本语义向量。这些向量包含了文本在不同抽象层次上的语义信息,为后续的知识集成和衍生提供了丰富素材。接着,通过知识语义集成分支对这些向量进行集成处理,得到会话语义集成向量;再通过知识衍生分支对集成向量进行知识衍生操作,生成多个层阶的会话语义衍生向量。这些衍生向量不仅继承了原始文本的语义信息,还融入了新的知识和关系。然后,利用语义复述分支对衍生向量进行语义复述处理(包括语义总结和语义细化),得到更加清晰、准确的会话语义复述向量。最后,通过知识语义优化分支对复述向量进行进一步优化处理,生成高质量的会话语义优化向量。基于这些优化向量和原始语义向量,系统能够自动确定会话文本数据源的知识库要素关系谱。
57、综上所述,本技术的知识库生成系统通过深度挖掘会话文本的语义信息并结合多种先进的人工智能技术实现了自动化、智能化的知识库构建和管理。这不仅提高了知识获取的效率和准确性还为后续的知识应用和创新提供了有力支持。
1.一种结合云计算的ai知识库生成方法,其特征在于,应用于ai知识库生成系统,所述ai知识库生成系统调用深度结构化语义网络进行ai知识库生成,所述深度结构化语义网络包括知识语义集成分支、知识衍生分支、语义复述分支和知识语义优化分支;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述利用所述知识语义优化分支基于所述x个层阶的会话语义复述向量,得到所述x个层阶的会话语义优化向量,包括:
3.根据权利要求2所述的方法,其特征在于,所述知识语义优化分支包括y个知识语义优化节点,y为正整数;
4.根据权利要求1所述的方法,其特征在于,所述基于所述x个层阶的会话语义优化向量和所述x个层阶的会话文本语义向量,确定所述第一会话文本数据源的知识库要素关系谱,包括:
5.根据权利要求1所述的方法,其特征在于,所述利用所述知识语义集成分支对所述x个层阶的会话文本语义向量进行集成,得到会话语义集成向量,包括:
6.根据权利要求1所述的方法,其特征在于,所述知识衍生分支包括x个知识衍生节点;所述利用所述知识衍生分支对所述会话语义集成向量进行知识衍生,得到所述x个层阶的会话语义衍生向量,包括:
7.根据权利要求1所述的方法,其特征在于,所述利用所述语义复述分支对所述x个层阶的会话语义衍生向量进行语义复述,得到所述x个层阶的会话语义复述向量,包括:对于所述x个层阶中的第u个层阶,利用所述语义复述分支对所述第u个层阶的会话语义衍生向量进行描述维度的窗口滤波,得到所述第u个层阶的会话语义复述向量,其中,所述描述维度的窗口滤波用于实现所述语义总结或语义细化,u为不大于x的正整数。
8.根据权利要求1所述的方法,其特征在于,所述深度结构化语义网络的调试方法包括:
9.根据权利要求8所述的方法,其特征在于,所述网络参量包括模型权重和偏置参数。
10.一种ai知识库生成系统,其特征在于,包括至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行权利要求1-9任一项所述的方法。