本说明书一个或多个实施例涉及医疗,尤其涉及一种基于医疗知识图谱的llm模型推理方法及相关设备。
背景技术:
1、大规模语言模型(large language models,llm),或者称之为预训练模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型,使用自监督学习方法通过在庞大且多样化的公开数据集上进行预训练,掌握了诸多语言现象。然而,llm模型是黑箱模型,往往不能捕捉和获取事实知识,并且时常会出现“幻觉”(hallucination),编造一些子虚乌有的内容。相比之下,知识图谱(knowledge graph)则是结构化的语义知识库,用于以符号形式描述物理世界中丰富的事实概念及其相互关系,其基本组成单位是“实体-关系-实体”三元组。
2、因此,如何准确利用知识图谱中存储的事实性知识来增强预训练模型的推理能力是亟待解决的问题。
技术实现思路
1、有鉴于此,本说明书一个或多个实施例提供一种基于医疗知识图谱的llm模型推理方法及相关设备。
2、第一方面,本说明书提供了一种基于知识图谱的llm模型推理方法,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述方法包括:
3、获取用户输入的目标文本,并确定所述目标文本中是否包含与所述知识图谱中的节点对应的实体;
4、如果是,则在所述知识图谱中查找出与所述实体相关的子图;其中,所述子图中包含与所述实体对应的节点,以及经由若干条边与该节点连接的多个邻居节点;
5、对所述子图进行特征提取,得到与所述目标文本相关的辅助信息;
6、根据所述辅助信息和所述目标文本构建提示词,并将所述提示词输入至所述llm模型中,由所述llm模型基于所述提示词执行逻辑推理,输出与所述目标文本对应的推理结果。
7、第二方面,本说明书提供了一种基于知识图谱的llm模型推理装置,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述装置包括:
8、确定单元,用于获取用户输入的目标文本,并确定所述目标文本中是否包含与所述知识图谱中的节点对应的实体;
9、子图查找单元,用于如果是,则在所述知识图谱中查找出与所述实体相关的子图;其中,所述子图中包含与所述实体对应的节点,以及经由若干条边与该节点连接的多个邻居节点;
10、辅助信息获取单元,用于对所述子图进行特征提取,得到与所述目标文本相关的辅助信息;
11、推理单元,用于根据所述辅助信息和所述目标文本构建提示词,并将所述提示词输入至所述llm模型中,由所述llm模型基于所述提示词执行逻辑推理,输出与所述目标文本对应的推理结果。
12、相应地,本说明书还提供了一种计算设备,包括:存储器和处理器;所述存储器上存储有可由所述处理器运行的计算机程序/指令;所述处理器运行所述计算机程序/指令时,执行上述第一方面所述的基于知识图谱的llm模型推理方法。
13、相应地,本说明书还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,所述计算机程序/指令被处理器运行时,执行如上述第一方面所述的基于知识图谱的llm模型推理方法。
14、相应地,本说明书还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时,执行如上述第一方面所述的基于知识图谱的llm模型推理方法。
15、综上所述,本申请先获取用户输入的目标文本,并确定该目标文本中是否包含与知识图谱中的节点对应的实体;如果是,则在该知识图谱中查找出与该实体相关的子图。其中,与该实体相关的子图中包含与该实体对应的节点,以及经由若干条边与该节点连接的多个邻居节点。然后,本申请可以对查找到的子图进行特征提取,得到与上述目标文本相关的辅助信息。进一步地,本申请可以根据辅助信息和目标文本构建提示词,并将构建得到的提示词输入至llm模型中,由该llm模型基于提示词执行逻辑推理,输出与目标文本对应的推理结果。如此,本申请在获取到用户输入的目标文本后,可以先确定出该文本中包含的与知识图谱中的节点对应的实体,再从知识图谱中抽取出与该实体相关的子图,并将该子图包含的内容作为辅助信息与目标文本一同输入至llm模型中,以辅助llm模型进行推理,从而实现了准确利用知识图谱中包含的信息来增强llm模型的推理能力,保证了llm模型最终输出的推理结果的正确性和可靠性,满足用户的实际使用需求。
1.一种基于知识图谱的llm模型推理方法,其特征在于,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述llm模型为基于与目标应用场景相关的数据对预训练完成的llm基础模型进行微调后得到的llm服务模型;所述目标文本为与所述目标应用场景相关的文本。
3.根据权利要求2所述的方法,其特征在于,所述目标应用场景为医疗问询场景,所述目标文本包括与医疗问询场景相关的医疗问询文本,所述推理结果包括医疗问询结果。
4.根据权利要求1所述的方法,其特征在于,所述对所述子图进行特征提取,得到与所述目标文本相关的辅助信息,包括:
5.根据权利要求4所述的方法,其特征在于,每条路径中包含的节点的数量在预设的数量范围内。
6.根据权利要求4所述的方法,其特征在于,所述子图包括多个三元组,每个三元组中包括在子图中连接的节点、边和另一节点;
7.根据权利要求6所述的方法,其特征在于,所述根据所述辅助信息和所述目标文本构建提示词,包括:
8.根据权利要求1-7任意一项所述的方法,其特征在于,所述子图为n-hop邻居子图,所述n-hop邻居子图中包括与所述实体对应的节点,以及经由至多n条边与该节点连接的多个邻居节点。
9.一种基于知识图谱的llm模型推理装置,其特征在于,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述装置包括:
10.一种计算设备,其特征在于,包括:存储器和处理器;所述存储器上存储有可由所述处理器运行的计算机程序/指令;所述处理器运行所述计算机程序/指令时,执行如权利要求1-8任意一项所述的方法。
11.一种计算机可读存储介质,其特征在于,其上存储有计算机程序/指令,所述计算机程序/指令被处理器执行时实现如权利要求1-8任意一项所述的方法。
12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如权利要求1-8任意一项所述的方法。