本技术涉及医疗信息,特别涉及一种鉴别诊断文书生成方法、装置、设备及存储介质。
背景技术:
1、病历是一份医疗文件,是医生和医护人员在医疗过程中记录患者信息和医疗状况的重要工具,对于医疗机构和患者双方都有着重要的作用。正确和规范的书写病历文书不仅能提高医疗质量和安全性,还能保护医患双方的合法权益。
2、然而,病历文书的书写在医生的日常工作中会占据大量的时间,尤其是首次病程记录的书写,一个完整的首次病程记录中通常包括主诉、病例特点、初步诊断、诊断依据、鉴别诊断和诊疗计划;其中,鉴别诊断的书写非常依赖医生的专业水平和判断能力,并且在首次病程记录的整个书写过程中占据了较多的书写时间,因此如何自动生成首次病程记录中的鉴别诊断是本领域目前需要解决的技术问题。
3、目前,针对鉴别诊断文书的自动生成,主流的方案是采用seq2seq(sequence tosequence,一种序列到序列的模型)的方法,其中seq2seq采用的是编码器-解码器(encoder-decoder)架构,编码器通常使用bilstm(bi-directional long short-termmemory,一种双向长短时记忆网络),解码器通常使用lstm(长短期记忆网络,long short-term memory),且二者均可以使用多层架构。具体的,可以构建文本上下文-鉴别诊断对的训练集,并利用该训练集对seq2seq模型进行训练,再利用训练后的seq2seq模型完成鉴别诊断文书的自动生成。同时,考虑到文本上下文可能较长,为了提升模型对长文本的处理能力,通常还会引入多跳注意力机制或分层注意力机制,从而提升模型编码器对长文本中关键信息的理解能力。
4、然而,上述鉴别诊断的生成方式单一,只通过文本生成的方式得到鉴别诊断会使生成的文书质量无法有效控制,并且,由于编码器和解码器的模型容量较小,使得模型对训练数据的理解不到位,导致在文本生成时,较易出现文本不连贯、语义重复、逻辑性错误、关键信息丢失、幻觉等现象,从而使生成的文书不符合预期。另外,对于给定对话流程,在进行鉴别诊断预测时,由于输入端需要经过编码器的编码以及解码器的解码,即按照逐字的生成方式,因此会导致实际鉴别诊断生成时的推理效率较低,从而降低了实用性。
技术实现思路
1、有鉴于此,本技术的目的在于提供一种鉴别诊断文书生成方法、装置、设备及存储介质,能够提高鉴别诊断的准确度,并提高了鉴别诊断文书的生成速度。其具体方案如下:
2、第一方面,本技术公开了一种鉴别诊断文书生成方法,包括:
3、获取当前目标患者在首次病程记录过程中记录的病历信息,得到当前病历信息;所述当前病历信息中包括主诉、病例特点、初步诊断和诊断依据;
4、将所述当前病历信息输入至预先创建的首次病程记录-鉴别诊断库中,以从所述首次病程记录-鉴别诊断库中匹配出与所述当前病历信息相似的目标病历,并获取与所述目标病历对应的鉴别诊断结果,得到第一鉴别诊断结果;
5、将所述当前病历信息中的初步诊断输入至预先创建的初步诊断-鉴别诊断库中,以从所述初步诊断-鉴别诊断库中匹配出与所述初步诊断相似的初步诊断结果,得到目标初步诊断结果,并获取与所述目标初步诊断结果对应的鉴别诊断结果,得到第二鉴别诊断结果;
6、将所述当前病历信息输入至训练后的中文医疗大模型中,以生成与所述当前病历信息对应的鉴别诊断结果,得到第三鉴别诊断结果;所述中文医疗大模型为利用海量中文医疗预料对chatglm-6b模型进行训练后得到的模型,整体架构采用解码器;
7、利用所述中文医疗大模型对所述第一鉴别诊断结果、所述第二鉴别诊断结果和所述第三鉴别诊断结果进行排序,得到排序后鉴别诊断结果,并将所述排序后鉴别诊断结果发送至目标医疗终端,以从所述排序后鉴别诊断结果中确定出最优鉴别诊断结果对应的鉴别诊断文书。
8、可选的,所述从所述首次病程记录-鉴别诊断库中匹配出与所述当前病历信息相似的目标病历,包括:
9、利用tf-idf算法和余弦相似度算法从所述首次病程记录-鉴别诊断库中匹配出与所述当前病历信息相似的病历,得到目标病历。
10、可选的,所述从所述初步诊断-鉴别诊断库中匹配出与所述初步诊断相似的初步诊断结果,得到目标初步诊断结果,包括:
11、对所述初步诊断进行术语标准化处理,得到标准化后初步诊断结果;
12、从所述初步诊断-鉴别诊断库中匹配出与所述标准化后初步诊断结果相似的初步诊断结果,得到目标初步诊断结果。
13、可选的,所述生成与所述当前病历信息对应的鉴别诊断结果,得到第三鉴别诊断结果,包括:
14、利用自定义的鉴别诊断生成提示词生成与所述当前病历信息对应的鉴别诊断结果,得到第三鉴别诊断结果。
15、可选的,所述利用所述中文医疗大模型对所述第一鉴别诊断结果、所述第二鉴别诊断结果和所述第三鉴别诊断结果进行排序,得到排序后鉴别诊断结果,并将所述排序后鉴别诊断结果发送至目标医疗终端,包括:
16、对所有所述第一鉴别诊断结果、所述第二鉴别诊断结果和所述第三鉴别诊断结果进行聚合,得到鉴别诊断候选集;
17、利用所述中文医疗大模型及自定义的鉴别诊断结果打分提示词对所述鉴别诊断候选集中的各个鉴别诊断结果进行打分,得到打分结果,并根据所述打分结果对所述鉴别诊断候选集中的各个鉴别诊断结果进行排序,得到排序后鉴别诊断结果;
18、按照分值从高到低的顺序从所述排序后鉴别诊断结果中选择出预设数量的鉴别诊断结果,并将所述预设数量的鉴别诊断结果发送至目标医疗终端。
19、可选的,所述对所有所述第一鉴别诊断结果、所述第二鉴别诊断结果和所述第三鉴别诊断结果进行聚合,得到鉴别诊断候选集,包括:
20、按照预设的优先级对所有所述第一鉴别诊断结果、所述第二鉴别诊断结果和所述第三鉴别诊断结果进行聚合,得到鉴别诊断候选集;所述预设的优先级从高到低依次为所述第二鉴别诊断结果、所述第一鉴别诊断结果、所述第三鉴别诊断结果。
21、可选的,所述中文医疗大模型的训练过程包括三个阶段,依次为预训练阶段、指令微调阶段和强化学习阶段;其中,所述预训练阶段用于基于海量中文医疗预料并通过自回归的方式对chatglm-6b模型进行训练,以完成模型的领域适配;所述指令微调阶段用于利用医疗知识图谱、在线问诊数据和医疗nlp方向的benchmark构建指令数据集,并利用所述指令数据集对所述预训练阶段得到模型进行训练,以使模型具备指令理解的能力;所述强化学习阶段用于利用所述指令微调阶段的输出训练一个reward模型,以生成满足预设鉴别诊断输出条件的打分模型。
22、第二方面,本技术公开了一种鉴别诊断文书生成装置,包括:
23、病历信息获取模块,用于获取当前目标患者在首次病程记录过程中记录的病历信息,得到当前病历信息;所述当前病历信息中包括主诉、病例特点、初步诊断和诊断依据;
24、第一诊断结果匹配模块,用于将所述当前病历信息输入至预先创建的首次病程记录-鉴别诊断库中,以从所述首次病程记录-鉴别诊断库中匹配出与所述当前病历信息相似的目标病历,并获取与所述目标病历对应的鉴别诊断结果,得到第一鉴别诊断结果;
25、第二诊断结果匹配模块,用于将所述当前病历信息中的初步诊断输入至预先创建的初步诊断-鉴别诊断库中,以从所述初步诊断-鉴别诊断库中匹配出与所述初步诊断相似的初步诊断结果,得到目标初步诊断结果,并获取与所述目标初步诊断结果对应的鉴别诊断结果,得到第二鉴别诊断结果;
26、诊断结果生成模块,用于将所述当前病历信息输入至训练后的中文医疗大模型中,以生成与所述当前病历信息对应的鉴别诊断结果,得到第三鉴别诊断结果;所述中文医疗大模型为利用海量中文医疗预料对chatglm-6b模型进行训练后得到的模型,整体架构采用解码器;
27、诊断结果排序模块,用于利用所述中文医疗大模型对所述第一鉴别诊断结果、所述第二鉴别诊断结果和所述第三鉴别诊断结果进行排序,得到排序后鉴别诊断结果;
28、诊断结果发送模块,用于将所述排序后鉴别诊断结果发送至目标医疗终端,以从所述排序后鉴别诊断结果中确定出最优鉴别诊断结果对应的鉴别诊断文书。
29、第三方面,本技术公开了一种电子设备,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的计算机程序时实现前述的鉴别诊断文书生成方法。
30、第四方面,本技术公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述的鉴别诊断文书生成方法。
31、可见,本技术先获取当前目标患者在首次病程记录过程中记录的病历信息,得到当前病历信息,然后将所述当前病历信息输入至预先创建的首次病程记录-鉴别诊断库中,以从所述首次病程记录-鉴别诊断库中匹配出与所述当前病历信息相似的目标病历,并获取与所述目标病历对应的鉴别诊断结果,得到第一鉴别诊断结果,再将所述当前病历信息中的初步诊断输入至预先创建的初步诊断-鉴别诊断库中,以从所述初步诊断-鉴别诊断库中匹配出与所述初步诊断相似的初步诊断结果,得到目标初步诊断结果,并获取与所述目标初步诊断结果对应的鉴别诊断结果,得到第二鉴别诊断结果,接着,将所述当前病历信息输入至利用海量中文医疗预料对chatglm-6b模型进行训练后得到的中文医疗大模型中,以生成与所述当前病历信息对应的鉴别诊断结果,得到第三鉴别诊断结果;所述中文医疗大模型整体架构采用解码器;最后,利用所述中文医疗大模型对所述第一鉴别诊断结果、所述第二鉴别诊断结果和所述第三鉴别诊断结果进行排序,得到排序后鉴别诊断结果,并将所述排序后鉴别诊断结果发送至目标医疗终端,以从所述排序后鉴别诊断结果中确定出最优鉴别诊断结果对应的鉴别诊断文书。本技术分别从首次病程记录-鉴别诊断库和初步诊断-鉴别诊断库中匹配出与当前目标患者在首次病程记录过程中记录的病历信息对应的鉴别诊断结果,并利用训练后的中文医疗大模型生成与当前病历信息对应的鉴别诊断结果,再对三种方式得到的所有鉴别诊断结果进行排序,最终通过目标医疗终端的响应确定出最优鉴别诊断结果对应的鉴别诊断文书,通过对多种方式得到的鉴别诊断结果进行排序,并从排序后的多个鉴别诊断结果中获取到最优的鉴别诊断结果,由于中文医疗大模型采用chatglm-6b模型,因此能够对海量中文医疗预料进行训练,从而提高了鉴别诊断的准确度,另外,由于模型整体架构采用解码器,即不涉及编码器的编码过程,因此提高了鉴别诊断结果的生成速度,即提高了鉴别诊断文书的生成速度。
1.一种鉴别诊断文书生成方法,其特征在于,包括:
2.根据权利要求1所述的鉴别诊断文书生成方法,其特征在于,所述从所述首次病程记录-鉴别诊断库中匹配出与所述当前病历信息相似的目标病历,包括:
3.根据权利要求1所述的鉴别诊断文书生成方法,其特征在于,所述从所述初步诊断-鉴别诊断库中匹配出与所述初步诊断相似的初步诊断结果,得到目标初步诊断结果,包括:
4.根据权利要求1所述的鉴别诊断文书生成方法,其特征在于,所述生成与所述当前病历信息对应的鉴别诊断结果,得到第三鉴别诊断结果,包括:
5.根据权利要求1所述的鉴别诊断文书生成方法,其特征在于,所述利用所述中文医疗大模型对所述第一鉴别诊断结果、所述第二鉴别诊断结果和所述第三鉴别诊断结果进行排序,得到排序后鉴别诊断结果,并将所述排序后鉴别诊断结果发送至目标医疗终端,包括:
6.根据权利要求5所述的鉴别诊断文书生成方法,其特征在于,所述对所有所述第一鉴别诊断结果、所述第二鉴别诊断结果和所述第三鉴别诊断结果进行聚合,得到鉴别诊断候选集,包括:
7.根据权利要求1至6任一项所述的鉴别诊断文书生成方法,其特征在于,所述中文医疗大模型的训练过程包括三个阶段,依次为预训练阶段、指令微调阶段和强化学习阶段;其中,所述预训练阶段用于基于海量中文医疗预料并通过自回归的方式对chatglm-6b模型进行训练,以完成模型的领域适配;所述指令微调阶段用于利用医疗知识图谱、在线问诊数据和医疗nlp方向的benchmark构建指令数据集,并利用所述指令数据集对所述预训练阶段得到模型进行训练,以使模型具备指令理解的能力;所述强化学习阶段用于利用所述指令微调阶段的输出训练一个reward模型,以生成满足预设鉴别诊断输出条件的打分模型。
8.一种鉴别诊断文书生成装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1至7任一项所述的鉴别诊断文书生成方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的鉴别诊断文书生成方法。