本说明书一个或多个实施例涉及医疗,尤其涉及一种基于知识图谱的医疗llm模型推理方法及相关设备。
背景技术:
1、大规模语言模型(large language models,llm),或者称之为预训练模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型,使用自监督学习方法通过在庞大且多样化的公开数据集上进行预训练,掌握了诸多语言现象。然而,llm模型是黑箱模型,往往不能捕捉和获取事实知识,并且时常会出现“幻觉”(hallucination),编造一些子虚乌有的内容。相比之下,知识图谱(knowledge graph)则是结构化的语义知识库,用于以符号形式描述物理世界中丰富的事实概念及其相互关系,其基本组成单位是“实体-关系-实体”三元组。
2、因此,如何准确利用知识图谱中存储的事实性知识来增强预训练模型的推理能力是亟待解决的问题。
技术实现思路
1、有鉴于此,本说明书一个或多个实施例提供一种基于知识图谱的医疗llm模型推理方法及相关设备。
2、第一方面,本说明书提供了一种基于知识图谱的llm模型推理方法,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述方法包括:
3、获取用户输入的目标文本,确定所述目标文本中是否包含与所述知识图谱中的节点对应的实体;
4、如果是,则在所述知识图谱中查找出与所述实体相关的子图;
5、获取保存的所述用户在所述目标文本之前输入的历史文本,并基于所述历史文本中包含的用户信息,对所述子图中包含的属性与所述用户信息不匹配的边进行裁剪,得到目标子图;
6、根据所述目标子图和所述目标文本构建提示词,并将所述提示词输入至第一llm模型中,由所述第一llm模型基于所述提示词执行逻辑推理,并输出与所述目标文本对应的推理结果。
7、第二方面,本说明书提供了一种基于知识图谱的llm模型推理装置,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述装置包括:
8、确定单元,用于获取用户输入的目标文本,确定所述目标文本中是否包含与所述知识图谱中的节点对应的实体;
9、子图查找单元,用于如果是,则在所述知识图谱中查找出与所述实体相关的子图;
10、子图裁剪单元,用于获取保存的所述用户在所述目标文本之前输入的历史文本,并基于所述历史文本中包含的用户信息,对所述子图中包含的属性与所述用户信息不匹配的边进行裁剪,得到目标子图;
11、推理单元,用于根据所述目标子图和所述目标文本构建提示词,并将所述提示词输入至第一llm模型中,由所述第一llm模型基于所述提示词执行逻辑推理,并输出与所述目标文本对应的推理结果。
12、相应地,本说明书还提供了一种计算设备,包括:存储器和处理器;所述存储器上存储有可由所述处理器运行的计算机程序/指令;所述处理器运行所述计算机程序/指令时,执行上述第一方面所述的基于知识图谱的llm模型推理方法。
13、相应地,本说明书还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,所述计算机程序/指令被处理器运行时,执行如上述第一方面所述的基于知识图谱的llm模型推理方法。
14、相应地,本说明书还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时,执行如上述第一方面所述的基于知识图谱的llm模型推理方法。
15、综上所述,本申请先获取用户输入的目标文本,并确定该目标文本中是否包含与知识图谱中的节点对应的实体;如果是,则在该知识图谱中查找出与该实体相关的子图。然后,本申请可以获取保存的用户在目标文本之前输入的历史文本,并基于该历史文本中包含的用户信息,对子图中包含的属性与该用户信息不匹配的边进行裁剪,得到目标子图。进一步地,本申请可以根据目标子图和目标文本构建提示词,并将构建得到的提示词输入至第一llm模型中,由该第一llm模型基于提示词执行逻辑推理,输出与目标文本对应的推理结果。如此,本申请在从知识图谱中抽取出与用户输入的目标文本中包含的实体相关的子图后,会进一步从保存的用户输入的历史文本中获取更加丰富全面的用户信息,并对该子图中不符合用户信息的边进行裁剪,再将裁剪后得到的目标子图与上述目标文本一同输入至llm模型中,以辅助llm模型进行推理。从而避免了子图中不符合用户信息的边对llm模型推理结果的干扰,保证了llm模型最终输出的推理结果的正确性和可靠性,符合用户的实际情况,满足用户的实际需求。
1.一种基于知识图谱的llm模型推理方法,其特征在于,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述目标文本和所述历史文本包括与医疗问询场景相关的医疗问询文本,所述推理结果包括医疗问询结果。
3.根据权利要求1所述的方法,其特征在于,所述确定所述目标文本中是否包含与所述知识图谱中的节点对应的实体,包括:
4.根据权利要求3所述的方法,其特征在于,所述对所述目标文本进行结构化处理,包括:
5.根据权利要求3所述的方法,其特征在于,所述对所述目标文本进行结构化处理,得到与所述目标文本对应的结构化信息,包括:
6.根据权利要求5所述的方法,其特征在于,所述应用场景包括以下示出的多种医疗问询场景中的任一种场景:医疗问诊场景、疾病科普场景、病例分析场景、用药建议场景。
7.根据权利要求3所述的方法,其特征在于,所述确定所述结构化信息包含的若干实体中是否包含与所述知识图谱中的节点对应的实体,包括:
8.根据权利要求3所述的方法,其特征在于,所述确定所述结构化信息包含的若干实体中是否包含与所述知识图谱中的节点对应的实体,包括:
9.根据权利要求3所述的方法,其特征在于,所述在所述知识图谱中查找出与所述实体相关的子图,包括:
10.根据权利要求9所述的方法,其特征在于,所述根据所述知识图谱中包含的多个实体类型之间的逻辑关系和与所述目标文本对应的所述结构化信息,确定针对所述知识图谱的搜索路径,包括:
11.根据权利要求1-10任意一项所述的方法,其特征在于,所述基于所述历史文本中包含的用户信息,对所述子图中包含的属性与所述用户信息不匹配的边进行裁剪,得到目标子图,包括:
12.一种基于知识图谱的llm模型推理装置,其特征在于,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述装置包括:
13.一种计算设备,其特征在于,包括:存储器和处理器;所述存储器上存储有可由所述处理器运行的计算机程序/指令;所述处理器运行所述计算机程序/指令时,执行如权利要求1-11任意一项所述的方法。
14.一种计算机可读存储介质,其特征在于,其上存储有计算机程序/指令,所述计算机程序/指令被处理器执行时实现如权利要求1-11任意一项所述的方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如权利要求1-11任意一项所述的方法。
