本发明涉及生物领域。具体地,本发明涉及生物标志物及其在胰腺导管癌患者生存期预测中的应用。
背景技术:
1、胰腺癌(pancreatic cancer,pc)是一种死亡率非常高的恶性肿瘤,其中胰腺导管癌占胰腺癌的80%-90%,主要由分化不同程度的导管样结构的腺体构成,伴有丰富的纤维间质。高分化导管腺癌主要由分化较好的导管样结构构成,内衬高柱状上皮细胞,有的为粘液样上皮,有的具有丰富的嗜酸性胞浆。胰腺癌所有阶段的总体5年生存率为9%,且仅有3%的转移性疾病患者在5年后存活。胰腺癌患者通常发现时已是晚期,大多数治疗方案无效。目前胰腺癌的预防、诊断和治疗干预措施均不尽如人意,导致总体预后不佳。
2、人类微生物群栖息在人们身体的每个表面和空腔中,包括超过一亿万亿种生物,包括细菌、病毒、真菌和原生动物。在大多数情况下,它们对生命至关重要且有益,但一小部分微生物群可能会导致各种疾病。肿瘤微生物每年导致约占全球癌症病例2%的约2万例病例产生,其流行病学、分子机制和临床研究正在被广泛研究。实验证据表明,额外的微生物可以通过基因毒素介导的诱变引发癌症。
3、目前,针对胰腺导管癌肿瘤微生物仍有待研究。
技术实现思路
1、需要说明的是,本发明是基于发明人的下列发现而完成的:
2、本发明的发明人基于tcga数据库中的胰腺导管癌转录组测序数据及临床数据,利用转录组数据探究了肿瘤微生物组在胰腺导管癌中的表达特征,使用克鲁斯卡尔-沃利斯检验筛选出与长短生存期有关且与样本中心来源无关的微生物,并通过人工文献检索找出在人类中可能出现的微生物作为备选微生物。下一步,发明人对备选微生物进行单因素和多因素cox回归分析,得出仅有窄食单胞菌属对生存影响显著。发明人进一步将窄食单胞菌属细分到种,主要包含5个种。对这5个种进行单因素和多因素cox回归分析,发现其中的3种影响生存,定义其为核心微生物。基于这3种包含于窄食单胞菌属下的微生物建立了风险值打分模型来预测患者的生存期,并在建模以外的患者数据集上得到了验证,说明本发明的预测方法具有潜在的临床应用价值。
3、为此,在本发明的一个方面,本发明提出了一种生物标志物。根据本发明的实施例,所述生物标志物选自下列至少一种:窄食单胞菌属、马杜拉放线菌、假黄单胞菌属、新立克次体、地中海杆菌属、雪松属、哈夫尼亚、固氮菌属、卟啉单胞菌属和脱硫菌属。发明人经过研究发现,上述生物标志物,尤其是窄食单胞菌属会显著影响胰腺导管癌患者的生存期,为预测胰腺导管癌的预后情况提供了潜在的生物标志物,便于准确地预测生存期,为胰腺导管癌患者的临床诊断和个性化治疗提供数据支持,应用价值高。
4、在本发明的另一方面,本发明提出了检测前面所述生物标志物的试剂在制备试剂盒中的应用。根据本发明的实施例,所述试剂盒用于预测胰腺导管癌患者的生存期。如前所述,本发明的生物标志物会显著影响胰腺导管癌患者的生存期,为预测胰腺导管癌的预后情况提供了潜在的生物标志物,便于准确地预测生存期,为胰腺导管癌患者的临床诊断和个性化治疗提供数据支持,应用价值高。
5、在本发明的又一方面,本发明提出了一种用于预测胰腺导管癌患者生存期机器学习模型的构建方法。根据本发明的实施例,所述方法包括:将胰腺导管癌患者的肿瘤组织中生物标志物的生物信息作为特征值,以所述胰腺导管癌患者的生存期作为标记,进行训练和测试,得到用于预测胰腺导管癌患者生存期的机器学习模型;所述生物标志物选自前面所述生物标志物。如前所述,本发明的生物标志物会显著影响胰腺导管癌患者的生存期,因此,将生物标志物的生物信息和胰腺导管癌患者的生存期相匹配,构建机器学习模型,可用于准确地预测胰腺导管癌患者的生存期。
6、在本发明的又一方面,本发明提出了一种胰腺导管癌患者生存期的预测系统。根据本发明的实施例,所述预测系统包括:生物信息获取模块,所述生物信息获取模块用于获取胰腺导管癌患者肿瘤组织中前面所述生物标志物的生物信息;分析模块,所述分析模块用于基于所述生物标志物的生物信息,预测所述胰腺导管癌患者的生存期。
7、在本发明的又一方面,本发明提出了一种电子设备。根据本发明的实施例,所述电子设备包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序以实现胰腺导管癌患者生存期预测方法,所述预测方法包括:获取胰腺导管癌患者肿瘤组织中前面所述生物标志物的生物信息;以所述生物标志物的生物信息作为特征,输入机器学习模型中,得到胰腺导管癌患者生存期预测结果,所述机器学习模型是利用前面所述用于预测胰腺导管癌患者生存期机器学习模型的构建方法获得的。
8、在本发明的又一方面,本发明提出了一种可执行的存储介质。根据本发明的实施例,所述存储介质存储有计算机程序指令,所述计算机程序指令在处理器上运行时,使得所述处理器执行胰腺导管癌患者生存期预测方法,所述预测方法包括:获取胰腺导管癌患者肿瘤组织中前面所述生物标志物的生物信息;以所述生物标志物的生物信息作为特征,输入机器学习模型中,得到胰腺导管癌患者生存期预测结果,所述机器学习模型是利用前面所述用于预测胰腺导管癌患者生存期机器学习模型的构建方法获得的。
9、本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
1.一种生物标志物,其特征在于,所述生物标志物选自下列至少一种:
2.根据权利要求1所述的生物标志物,其特征在于,所述生物标志物选自窄食单胞菌属以及任选的下列至少一种:马杜拉放线菌、假黄单胞菌属、新立克次体、地中海杆菌属、雪松属、哈夫尼亚、固氮菌属、卟啉单胞菌属和脱硫菌属;
3.检测权利要求1或2所述生物标志物的试剂在制备试剂盒中的应用,其特征在于,所述试剂盒用于预测胰腺导管癌患者的生存期。
4.根据权利要求3所述的应用,其特征在于,所述生存期选自短生存期或长生存期,所述短生存期选自小于1年且死亡,所述长生存期选自大于等于3年。
5.根据权利要求3所述的应用,其特征在于,所述检测生物标志物的试剂包括检测生物标志物相对丰度的试剂。
6.一种用于预测胰腺导管癌患者生存期机器学习模型的构建方法,其特征在于,包括:
7.一种胰腺导管癌患者生存期的预测系统,其特征在于,包括:
8.根据权利要求7所述的预测系统,其特征在于,所述分析模块用于采用所述生物标志物的生物信息作为机器学习模型的输入特征,利用权利要求6所述用于预测胰腺导管癌患者生存期机器学习模型的构建方法获得的机器学习模型进行训练,预测所述胰腺导管癌患者的生存期;
9.一种电子设备,其特征在于,包括:存储器和处理器;
10.一种可执行的存储介质,其特征在于,所述存储介质存储有计算机程序指令,所述计算机程序指令在处理器上运行时,使得所述处理器执行胰腺导管癌患者生存期预测方法,所述预测方法包括: