本发明涉及医疗沟通,尤其涉及一种基于宣教模型的患者智能宣教方法。
背景技术:
1、癌症发病率呈逐年上升趋势,而医护人员却严重不足。医护人员与患者之间的沟通不足可能会导致患者产生不良情绪,并影响他们的治疗进度。一种提高沟通的可行办法是利用语言模型作为宣教的有效工具,通过自动化生成文本,与患者实时沟通,解答患者的疑虑,缓解患者的心理焦虑。
2、因此,提出一种基于宣教模型的患者智能宣教方法,来解决现有技术医护人员紧张,医患沟通不足,影响患者的治疗进度的问题,是本领域技术人员亟须解决的问题。
技术实现思路
1、有鉴于此,本发明提供了一种基于宣教模型的患者智能宣教方法,可以达到高稳定性均衡的效果。
2、为了实现上述目的,本发明采用如下技术方案:
3、一种基于宣教模型的患者智能宣教方法,包括以下步骤:
4、数据获取步骤:根据对患者的调查统计,获得宣教数据集;
5、模型训练步骤:将宣教数据集中概念拼装为多样复杂的提问语句输入宣教模型,基于小样本学习方法对宣教模型进行训练,获得训练好的宣教模型;
6、模型分析步骤:对训练好的宣教模型进行分析,获得三组最佳解码参数,将三组最佳解码参数设置为模型的备选解码方案,利用解码方案将宣教数据集内的问题生成三类答案,根据医生和患者分别对生成的答案进行排序,分别构建医生偏好数据集和患者偏好数据集;
7、模型优化步骤:利用医生偏好数据集和患者偏好数据集分别训练医生偏好奖励模型和患者偏好奖励模型,利用对抗性训练对模型进行优化,获得优化后的宣教模型;
8、模型评判步骤:通过专家对优化后的宣教模型进行评判,选取最终的宣教模型;
9、网上运用步骤:将最终的宣教模型与网络平台连接,根据患者询问内容进行答复宣教。
10、上述的方法,可选的,模型训练步骤中,宣教模型包括:
11、获取医学领域对话语料数据、模型参数和belle数据集;
12、根据模型参数和belle数据集迁移学习大语言模型语句建模能力,获得初始模型;
13、将医学领域对话语料数据输入初始模型,利用极大似然估计算法优化初始模型,获得宣教模型。
14、上述的方法,可选的,模型参数为hugging face网站获取使用中文语料预训练过的模型参数。
15、上述的方法,可选的,极大似然估计算法为:
16、
17、其中,xt为句子序列中第t个词,t为句子长度,为噪声语句。
18、上述的方法,可选的,模型训练步骤中,小样本学习方法包括采用对比学习作为优化目标,采用对抗攻击增强样本语义,对比学习优化目标表述方式如下:
19、
20、si,0=sim(x,x+),
21、si,j=sim(x,xj-)j=1,2,...n,
22、其中,si,0为源序列与正向样本序列的相似度,si,j为源样本与负向样本序列的相似度,τ为温度系数,取值为2,m为余量,取值为0.05。
23、上述的方法,可选的,模型训练步骤中,小样本学习方法还包括采用编码器-解码器结构;
24、编码器内部编写模型输入正样本和模型输入负样本,输出端计算对比学习损失;利用对抗攻击的语义增强算法,在语义层面对语句加入噪声;将宣教数据集和belle数据集输入编码器-解码器,利用极大似然估计算法对编码器-解码器进行端到端的训练,得到具备标准化宣教能力的语言模型。
25、上述的方法,可选的,模型优化步骤中,包括:利用rlhf算法,根据患者的偏好性数据设计患者奖励模型,根据医护人员的偏好性数据设计医护人员奖励模型;宣教模型给出不同解码参数下模型对同一提问给出的多种答复,由患者和医生分别进行优劣排序,得到的数据分别训练患者奖励模型和医护人员奖励模型;
26、奖励模型的训练表述方式如下:
27、
28、其中,θ为语言模型参数,k为语言模型生成的一组回答个数,为在输入问题为x的条件下,从数据集d中拿出yw,yl两个回答;rθ为基于奖励模型对输出回答的打分函数;σ为归一化函数,将奖励分数映射到(0,1)区间。
29、上述的方法,可选的,模型优化步骤中,基于奖励模型对宣教模型进行优化,利用近端策略优化算法ppo进行训练,对患者奖励模型和医护人员奖励模型生成的分数计算随机加权平均值作为最终奖励分数,加入kl散度和梯度裁剪对模型参数进行共同约束,其中,ppo算法优化目标表述方式如下:
30、
31、其中,πθ(*)是实时更新的语言模型,是参考模型,at是当前语言模型得到的状态值,st是历史状态值,是计算历史状态条件下得到当前状态的决策值,
32、kl散度和梯度裁剪表述方式如下:
33、
34、
35、对抗模型生成器优化采用基于患者偏好的奖励模型,判别器采用基于医生偏好的奖励模型,通过wasserstein距离构建损失函数,表述如下:
36、
37、其中,为生成器生成的样本,x为数据集中标准宣教文本数据,d(*)表示基于判别器的判别函数。
38、经由上述的技术方案可知,与现有技术相比,本发明提供了一种基于宣教模型的患者智能宣教方法,具有以下有益效果:1)本发明概念更为新颖:现有模型很少有专门针对医学领域设计训练方法并进行精准宣教的,本方法设计出的模型专门适用于标准化宣教;2)本发明推广度高:采用类似迁移学习和模型蒸馏的方式,使参数规模小的模型也可以实现语句建模和输出宣教语句,硬件要求较大语言模型显著降低,两张v卡可部署;3)本发明精度高:加入了对比学习,使模型的注意力可以集中在患者问句中的关键词汇,并给出准确的宣教回复。
1.一种基于宣教模型的患者智能宣教方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于宣教模型的患者智能宣教方法,其特征在于,
3.根据权利要求2所述的一种基于宣教模型的患者智能宣教方法,其特征在于,
4.根据权利要求2所述的一种基于宣教模型的患者智能宣教方法,其特征在于,
5.根据权利要求4所述的一种基于宣教模型的患者智能宣教方法,其特征在于,
6.根据权利要求5所述的一种基于宣教模型的患者智能宣教方法,其特征在于,
7.根据权利要求6所述的一种基于宣教模型的患者智能宣教方法,其特征在于,
8.根据权利要求7所述的一种基于宣教模型的患者智能宣教方法,其特征在于,
