本发明涉及术后并发症风险预测,尤其是涉及一种术后并发症风险的多任务联合优化预测方法及系统。
背景技术:
1、由于术后并发症(如肺部并发症、心血管不良、icu入室等)风险(简称术后风险)所导致的术后30天内死亡,已成为全球排名第三位的人群死亡原因。准确的术后并发症风险预测对临床麻醉医生进行合理的临床资源规划、应急方案准备具有重要的辅助作用,对降低患者的术后并发症风险和死亡率具有积极意义。
2、目前,术后并发症风险预测主要通过对单一类型的术后并发症风险是否会发生这一预测任务进行分别建模(后文简称“单任务术后并发症风险预测方法”)来实现。例如,分别建立三个模型,包括术后肺部并发症风险预测模型、术后心血管不良并发症风险预测模型、术后急性肾损伤并发症风险预测模型,来分别预测术后肺部并发症、术后心血管不良并发症、术后急性肾损伤并发症等三类风险事件的发生,即将术后并发症风险预测从单一类型的术后并发症风险是否会发生的角度分别建立三个二分类模型实现术后并发症风险预测。
3、此外,单任务术后并发症风险预测方法的研究主要集中于统计机器学习模型应用于术后并发症风险预测的有效性验证及面向特定类型的术后并发症风险特征分析两个层面。随着深度学习模型在通用领域的预测任务上的表现出众,近期有研究者开始将深度学习模型的“编码-解码”框架引入单任务术后并发症风险预测方法的研究,并取得了优于采用统计机器学习模型的术后并发症风险预测的效果,是目前最先进的方法。
4、然而,从临床角度看,临床麻醉医生在进行术后并发症风险预测时,通常是在患者术前,根据术前患者的基础检查数据和医生的诊断记录,对患者术后是否会发生各类术后并发症风险事件进行综合判断。换句话说,临床麻醉医生除根据术前患者的基础检查数据和医生的诊断记录分别判断各类术后并发症风险事件是否会发生之外,还会根据术后并发症之间在医学上的关联,联合判断患者是否会发生术后并并发症风险。
5、此外,从技术角度看,采用基于“编码-解码”框架的单任务术后并发症风险预测方法,一方面会丢失各术后并发症预测任务之间的潜在医学语义关联信息,从而降低模型的预测效果。在效果图部分的实验数据表1中可以看到,采用单任务术后并发症风险预测方法的性能低于多任务联合优化方法的预测性能;另一方面会存在模型训练成本开销较大的问题。在临床上,术后并发症风险的类别众多,常见的术后并发症风险就已经有十余大类,而如果对这十余大类进行细化,可以分出几十甚至百余种术后并发症风险小类,采用单任务术后并发症风险预测方法,需要训练几十甚至几百个单任务术后并发症风险预测模型,这极大的增加了计算资源的开销,也间接的降低了单任务术后并发症风险预测在应用时的推理服务效率。更进一步地,采用单任务术后并发症风险预测方法,模型训练后,还会带来模型参数的存储资源开销较大的问题。
技术实现思路
1、本发明提供一种术后并发症风险的多任务联合优化预测方法及系统,利用深度学习在模型参数迁移方面能力的优势,基于“编码-解码”框架,采用共享编码层的特征表示方法,将多个单任务术后并发症风险预测任务进行联合建模,建立术后并发症风险的多任务联合优化预测方法。该方法通过将原来的各单任务术后并发症风险预测模型分别对共用的术前患者的基础检查数据和医生的诊断记录进行编码,然后分别解码进行预测,改为各单任务术后并发症风险预测模型联合优化共享对术前患者的基础检查数据和医生的诊断记录进行编码的过程,然后再分别根据各术后并发症风险类型的不同,进行解码预测。
2、本发明一方面公开了一种术后并发症风险的多任务联合优化预测方法,包括:
3、s1.通过结构化特征提取器,从结构化的术前患者的基础检查数据中提取得到连续型数值特征向量矩阵和分类型离散特征向量矩阵;
4、s2.通过非结构化特征提取器,从非结构化的术前患者的诊断记录数据中提取得到语义嵌入特征向量矩阵;
5、s3.通过基于transformer的术后并发症风险预测特征编码器,将所述连续型数值特征向量矩阵、分类型离散特征向量矩阵和语义嵌入特征向量矩阵进行编码,得到编码数据;
6、s4.通过基于全联接层的术后并发症风险预测解码器,采用全联接层拼接的方式对所述编码数据进行单任务术后并发症风险预测解码,得到各单任务术后并发症风险预测解码数据;
7、s5.通过基于sigmoid模块的单任务术后并发症风险预测器,对所述各单任务术后并发症风险预测解码数据进行各单任务术后并发症风险预测,得到预测概率。
8、本发明所述结构化特征提取器从结构化数据源中根据数据类型分类地提取出结构化数据,所述结构化数据包括连续型数值特征向量矩阵和分类型离散特征向量矩阵。
9、本发明所述非结构化特征提取器从非结构化数据源中将非结构化数据进行切分,形成语义单元,并利用基于双向编码表达的transformer将语义单元转化为语义嵌入特征向量,并单独提取非结构化数据中的医学实体语义单元,将医学实体语义单元一并编码到语义嵌入特征向量中,得到语义嵌入特征向量矩阵。
10、本发明所述基于transformer的术后并发症风险预测特征编码器将所述连续型数值特征向量矩阵和分类型离散特征向量矩阵进行拼接后得到拼接数据,将语义嵌入特征向量矩阵进行复制得到复制数据,最后将所述拼接数据和复制数据进行拼接后得到所述基于transformer的术后并发症风险预测特征编码器的输入数据。
11、本发明所述基于transformer的术后并发症风险预测特征编码器将所述输入数据与所述基于全联接层的术后并发症风险预测解码器进行对接,并综合考量多任务术后并发症风险预测目标,进行全局优化。
12、本发明所述基于全联接层的术后并发症风险预测解码器的参数学习过程受多任务联合优化预测模型约束,所述多任务联合优化预测模型为:
13、;
14、其中,为损失函数,为权重因子,为单任务在最终的输出层采用sigmoid模块进行输出的预测概率,为用于平衡正负样本的权重,为可调节的超参数,为任务的损失在联合建模中的权重,为任务的损失,t为一次联合建模的术后并发症风险预测任务的数量。
15、本发明所述基于sigmoid模块的单任务术后并发症风险预测器的参数学习过程受所述多任务联合优化预测模型约束。
16、本发明另一方面公开了一种术后并发症风险的多任务联合优化预测系统,用于实现上述中任一项所述的术后并发症风险的多任务联合优化预测方法;所述术后并发症风险的多任务联合优化预测系统包括:
17、结构化特征提取器,用于从结构化的术前患者的基础检查数据中提取得到连续型数值特征向量矩阵和分类型离散特征向量矩阵;
18、非结构化特征提取器,用于从非结构化的术前患者的诊断记录数据中提取得到语义嵌入特征向量矩阵;
19、基于transformer的术后并发症风险预测特征编码器,用于将所述连续型数值特征向量矩阵、分类型离散特征向量矩阵和语义嵌入特征向量矩阵进行编码,得到编码数据;
20、基于全联接层的术后并发症风险预测解码器,用于采用全联接层拼接的方式对所述编码数据进行单任务术后并发症风险预测解码,得到各单任务术后并发症风险预测解码数据;
21、基于sigmoid模块的单任务术后并发症风险预测器,用于对所述各单任务术后并发症风险预测解码数据进行各单任务术后并发症风险预测,得到预测概率。
22、本发明至少可以实现以下有益效果:
23、一方面,从临床角度看,本发明利用“编码-解码”框架,形式化地模拟了临床麻醉医生的术后并发症风险综合判断过程。通过编码层共享,在模型中建模了术后并发症之间在医学上的关联关系;通过解码层独立,在模型中建模了术后并发症之间在医学上的差异特质。另一方面,从技术角度看,本发明利用“编码-解码”框架,建模了各术后并发症预测任务之间的潜在医学语义关联信息,并且通过共用编码部分的参数,大幅降低了模型训练成本的开销,也大幅降低了训练得到的模型参数的存储空间,以及在推理时编码部分所需要的计算开销。
1.一种术后并发症风险的多任务联合优化预测方法,其特征在于,包括:
2.根据权利要求1所述的术后并发症风险的多任务联合优化预测方法,其特征在于,从结构化数据源中根据数据类型分类地提取出结构化数据,所述结构化数据包括连续型数值特征向量矩阵和分类型离散特征向量矩阵。
3.根据权利要求1所述的术后并发症风险的多任务联合优化预测方法,其特征在于,从非结构化数据源中将非结构化数据进行切分,形成语义单元,并利用基于双向编码表达的transformer将语义单元转化为语义嵌入特征向量,并单独提取非结构化数据中的医学实体语义单元,将医学实体语义单元一并编码到语义嵌入特征向量中,得到语义嵌入特征向量矩阵。
4.根据权利要求1所述的术后并发症风险的多任务联合优化预测方法,其特征在于,将所述连续型数值特征向量矩阵和分类型离散特征向量矩阵进行拼接后得到拼接数据,将语义嵌入特征向量矩阵进行复制得到复制数据,最后将所述拼接数据和复制数据进行拼接后得到编码的输入数据。
5.根据权利要求4所述的术后并发症风险的多任务联合优化预测方法,其特征在于,将所述输入数据与解码器进行对接,并综合考量多任务术后并发症风险预测目标,进行全局优化。
6.根据权利要求5所述的术后并发症风险的多任务联合优化预测方法,其特征在于,解码器的参数学习过程受多任务联合优化预测模型约束,所述多任务联合优化预测模型为:
7.根据权利要求6所述的术后并发症风险的多任务联合优化预测方法,其特征在于,所述各单任务术后并发症风险预测的模型参数学习过程受所述多任务联合优化预测模型约束。
8.一种术后并发症风险的多任务联合优化预测系统,其特征在于,用于实现权利要求1至7中任一项所述的术后并发症风险的多任务联合优化预测方法;所述术后并发症风险的多任务联合优化预测系统包括: