基于单细胞和混池转录组联用的晚期下咽癌治疗疗效预测方法

专利检索2025-04-25  11

本发明涉及生物信息,具体地,本发明涉及基于单细胞和混池转录组联用的晚期下咽癌治疗疗效预测方法。
背景技术
::1、头颈部鳞状细胞癌(head and neck squamous cell carcinoma,hnscc)是世界范围第六大恶性肿瘤。其中,亚瘤种下咽鳞状细胞癌(hypopharyngeal squamous cellcancer,hscc,以下简称为下咽癌)虽然发病率较低(仅占所有头颈部鳞状细胞癌病例的5%-10%),但因其病发位置隐蔽,侵袭性强,临床诊断时已多属晚期。现阶段对晚期下咽癌的一线化疗方案以tpf方案(铂类、紫杉醇、5-氟尿嘧啶等)联合egfr的靶向治疗为主,希望借此减小肿瘤体积以达到手术切除肿瘤病变组织的治疗目的。然而,临床实践中仅有不到半数的晚期下咽癌患者对联合治疗产生响应。目前,现有的治疗前评估方式如ct影像学无法对肿瘤内部复杂微环境构成和细胞间分子交互等特征进行全局捕捉,不具有指导方案选择的作用。2、因此临床上亟需新方法对治疗前患者的治疗敏感性进行精准预测。技术实现思路1、本发明旨在至少在一定程度上解决现有技术中存在的技术问题至少之一。2、肿瘤不仅仅是大量恶性细胞的聚集团块,而且是由复杂理化环境和多种免疫及非免疫细胞组成的复杂“器官”,也被称为肿瘤微环境(tumor microenvironment,tme)。非恶性肿瘤细胞通过趋化因子、炎症因子和基质重塑酶等构建了动态变化的组织背景,并由此介导它们和肿瘤细胞间的相互作用,对肿瘤的发生、发展和治疗响应产生重要影响。现阶段,以短读长为基础的高通量测序特别是高分辨率的单细胞测序技术的发展,为肿瘤微环境解析和治疗响应分析提供了具体帮助。3、因此,对于晚期下咽癌的临床样本,发明人尝试综合在转录组层面综合利用单细胞分辨率高、细胞亚型分型准确,和混池测序操作便捷、费用低廉、易推广的优势,建立基于微环境内细胞亚型构成和治疗响应间的定量关系,希望以此完成治疗前晚期下咽癌患者对治疗敏感性,尤其是对一线化疗方案以tpf方案(铂类、紫杉醇、5-氟尿嘧啶等)联合egfr的靶向治疗联合治疗敏感性的预测。4、为此,在本发明的一个方面,本发明提出了一种对下咽癌进行分类的装置。根据本发明的实施例,所述装置包括获取模块,用于获取下咽癌组织的细胞组成信息;和判断模块,用于将所述细胞组成信息输入至经过训练的机器学习模型,以便获得所述下咽癌的预后结果,其中,所述获取模块进一步包括:测序模块,用于获取所述下咽癌组织的测序结果;和分类模块,用于基于所述测序结果和预先确定的细胞类型判断标准,确定所述下咽癌组织的所述细胞组成信息,所述细胞类型判断标准是通过单细胞测序确定的。根据本发明实施例的分类装置可以对下咽癌组织进行分类,以确定所述组织来源的下咽癌患者是否对治疗敏感,即产生响应,尤其是否对tpf方案(铂类、紫杉醇、5-氟尿嘧啶等)联合egfr的靶向治疗联合治疗敏感。5、为此,在本发明的一个方面,本发明提出了一种对下咽癌进行分类的装置。根据本发明的实施例,所述装置包括获取模块,用于获取下咽癌组织的细胞组成信息;和判断模块,用于将所述细胞组成信息输入至经过训练的机器学习模型,以便获得所述下咽癌的联合治疗疗效预测结果,其中,所述获取模块进一步包括:测序模块,用于获取所述下咽癌组织的混池转录组测序结果;和分析模块,用于基于所述测序结果和预先确定的细胞类型判断标准,确定所述下咽癌组织的所述细胞组成信息,所述细胞类型判断标准是通过单细胞转录组测序确定的。根据本发明实施例的分类装置可以对下咽癌组织进行分类,以确定所述组织来源的下咽癌患者是否对治疗敏感,即产生响应,尤其是否对tpf方案(铂类、紫杉醇、5-氟尿嘧啶等)联合egfr的靶向治疗联合治疗敏感。6、根据本发明的实施例,上述对下咽癌进行分类的装置还可以进一步包括如下附加技术特征至少之一:7、根据本发明的实施例,所述机器学习模型包括选自支持向量机、决策树、随机森林、神经网络或逻辑回归算法的至少之一。8、根据本发明的实施例,所述机器学习模型包括选自回归算法、支持向量机、决策树、随机森林和以神经网络为基础的深度机器学习算法的至少之一。9、根据本发明的实施例,所述细胞组成信息包括促进肿瘤发展的细胞和抑制肿瘤发展的细胞至少之一的数量信息:其中,所述促进肿瘤发展的细胞包括endoblood2,caf2,cd8t_exhaust,cd4treg,cdc2和macrophagem2的至少之一;所述抑制肿瘤发展的细胞包括endoblood1,caf1,cd8t_naive,cd8t_cytotoxic,cd4th,monocyte,pdc,modc和cdc1的至少之一。10、根据本发明的实施例,所述细胞组成信息包括所述各细胞类型的比例。11、根据本发明的实施例,所述下咽癌组织的测序结果是通过混池转录组测序(bulkrna-seq)获得的。12、根据本发明的实施例,所述下咽癌组织的测序结果是通过bulk测序获得的。13、根据本发明的实施例,所述细胞类型判断标准包括细胞类型特异性基因、细胞类型特异性表达谱。14、根据本发明的实施例,所述细胞组成信息是通过下列步骤确定的:对所述下咽癌组织的测序结果进行第一过滤处理;将第一过滤处理后的测序结果与参考基因进行比对处理,以获得基因表达量;基于所述基因表达量,对所述测序结果进行第二过滤处理;将经过第二过滤处理的测序结果进行基因长度归一化处理;将经过基因长度归一化处理的测序结果使用cibersortx进行在线细胞组成分解,以便获得所述细胞组成信息。15、根据本发明的实施例,所述细胞组成信息是通过下列步骤确定的:对所述下咽癌组织的测序结果进行第一过滤处理;将第一过滤处理后的测序结果与参考基因组进行比对处理,以获得基因表达量;基于所述基因表达量,对所述测序结果进行第二过滤处理;将经过第二过滤处理的测序结果进行测序深度和基因长度的归一化处理;将经过归一化处理的测序结果使用基于单细胞转录组对混池转录组样本完成细胞占比解构的工具(如cibersortx)进行分析,以便获得所述细胞组成信息。16、需要说明的是,本技术所述的“第一过滤处理”是指利用fastqc和cutadpat工具对所述下咽癌组织的测序结果分别进行测序质量检测和低质量碱基序列减除;本技术所述的“第二过滤处理”是指利用hisat2工具对基因表达量进行测序数据比对、featurecounts工具对单样本混池转录组数据进行基因层面的表达定量后,过滤低表达基因。17、根据本发明的具体实施例,所述细胞组成信息的获得可以分为以下几个步骤:18、1)临床样本混池转录组测序(bulk rna-seq)数据的预处理:利用fastqc和cutadpat工具分别进行测序质量检测和低质量碱基序列减除达到第一过滤的目的,得到过滤后配对的fastq文件;以人基因组hg38版本为参考序列,利用hisat2工具对过滤后配对的fastq文件进行测序数据比对、featurecounts工具对单样本混池转录组数据进行基因层面的表达定量;过滤低表达基因以达到第二过滤的目的;利用计算方法对多样本混池转录组数据进行归一化处理,如edger r包内tmm(trimmed mean of m-values)策略;以人基因组注释文件为基础统计不同基因的外显子长度后,对上述归一化后的多样本基因表达量做基因长度的归一化处理;整理表达矩阵形式(首行为列信息标注,首列为基因名,table分隔的文本文件)19、2)基于单细胞转录组对混池转录组样本完成细胞占比解构的工具有很多种,如cibersortx、bayesprism、aric和其他方法。此处,以cibersortx在线工具为例进行阐述说明。样本混池转录组表达数据cibersortx提交和出结果:登录网页https://cibersortx.stanford.edu/进行在线细胞组成分解。其中,选择分析模块“impute cellfractions”,设置“s-mode batch correction”和“disable quantile normalization”,其他参数保持默认,提交对应文件后,10-30min后即可下载获取细胞组成信息。20、根据本发明的实施例,所述细胞类型特异性基因包括表1所示的至少之一的特征性基因。21、在本发明的另一个方面,本发明提出了一种对下咽癌进行分类的方法。根据本发明的实施例,所述方法包括:获取下咽癌组织的细胞组成信息;和将所述细胞组成信息输入至经过训练的分类模型,以便获得所述下咽癌的分类,其中,所述细胞组成信息是通过下列步骤确定的:获取所述下咽癌组织的测序结果;和基于所述测序结果和预先确定的细胞类型判断标准,确定所述下咽癌组织的所述细胞组成信息,所述细胞类型判断标准是通过单细胞测序确定的。根据本发明实施例的分类方法可以确定所述组织来源的下咽癌患者是否对治疗敏感,即产生响应,尤其是否对tpf方案(铂类、紫杉醇、5-氟尿嘧啶等)联合egfr的靶向治疗联合治疗敏感。22、在本发明的另一个方面,本发明提出了一种对下咽癌进行分类的方法。根据本发明的实施例,所述方法包括:获取下咽癌组织的细胞组成信息;和将所述细胞组成信息输入至经过训练的判别模型,以便获得所述下咽癌的疗效类别,其中,所述细胞组成信息是通过下列步骤确定的:获取所述下咽癌组织的混池转录组测序结果;和基于所述测序结果和预先确定的细胞类型判断标准,确定所述下咽癌组织的所述细胞组成信息,所述细胞类型判断标准是通过单细胞转录组测序确定的。根据本发明实施例的分类方法可以确定所述组织来源的下咽癌患者是否对治疗敏感,即产生响应,尤其是否对tpf方案(铂类、紫杉醇、5-氟尿嘧啶等)联合egfr的靶向治疗联合治疗敏感。23、根据本发明的实施例,所述对下咽癌进行分类的方法还可以进一步包括如下附加技术特征至少之一:24、根据本发明的实施例,所述分类模型包括选自支持向量机、决策树、随机森林、神经网络或逻辑回归算法的至少之一。25、根据本发明的实施例,所述判别模型包括选自回归算法、支持向量机、决策树、随机森林和以神经网络为基础的深度机器学习算法的至少之一。26、根据本发明的实施例,所述细胞组成信息包括促进肿瘤发展的细胞和抑制肿瘤发展的细胞至少之一的数量信息:其中,所述促进肿瘤发展的细胞包括endoblood2,caf2,cd8t_exhaust,cd4treg,cdc2和macrophagem2的至少之一;所述抑制肿瘤发展的细胞包括endoblood1,caf1,cd8t_naive,cd8t_cytotoxic,cd4th,monocyte,pdc,modc和cdc1的至少之一。27、根据本发明的实施例,所述细胞组成信息包括所述各细胞类型的比例。28、根据本发明的实施例,所述下咽癌组织的测序结果是通过混池转录组测序(bulkrna-seq)获得的。29、根据本发明的实施例,所述下咽癌组织的测序结果是通过bulk测序获得的。30、根据本发明的实施例,所述细胞类型判断标准包括细胞类型特异性基因、细胞类型特异性表达谱。31、根据本发明的实施例,所述细胞组成信息是通过下列步骤确定的:对所述下咽癌组织的测序结果进行第一过滤处理;将第一过滤处理后的测序结果与参考基因进行比对处理,以获得基因表达量;基于所述基因表达量,对所述测序结果进行第二过滤处理;将经过第二过滤处理的测序结果进行基因长度归一化处理;将经过基因长度归一化处理的测序结果使用cibersortx进行在线细胞组成分解,以便获得所述细胞组成信息。32、根据本发明的实施例,所述细胞组成信息是通过下列步骤确定的:对所述下咽癌组织的测序结果进行第一过滤处理;将第一过滤处理后的测序结果与参考基因组进行比对处理,以获得基因表达量;基于所述基因表达量,对所述测序结果进行第二过滤处理;将经过第二过滤处理的测序结果进行测序深度和基因长度的归一化处理;将经过归一化处理的测序结果使用基于单细胞转录组对混池转录组样本完成细胞占比解构的工具(如cibersortx)进行分析,以便获得所述细胞组成信息。33、需要说明的是,本技术所述的“第一过滤处理”是指利用fastqc和cutadpat工具对所述下咽癌组织的测序结果分别进行测序质量检测和低质量碱基序列减除;本技术所述的“第二过滤处理”是指利用hisat2工具对基因表达量进行测序数据比对、featurecounts工具对单样本混池转录组数据进行基因层面的表达定量后,过滤低表达基因。34、根据本发明的具体实施例,所述细胞组成信息的获得可以分为以下几个步骤:35、1)临床样本混池转录组测序(bulk rna-seq)数据的预处理:利用fastqc和cutadpat工具分别进行测序质量检测和低质量碱基序列减除达到第一过滤的目的,得到过滤后配对的fastq文件;以人基因组hg38版本为参考序列,利用hisat2工具对过滤后配对的fastq文件进行测序数据比对、featurecounts工具对单样本混池转录组数据进行基因层面的表达定量;过滤低表达基因以达到第二过滤的目的;利用计算方法对多样本混池转录组数据进行归一化处理,如edger r包内tmm(trimmed mean of m-values)策略;以人基因组注释文件为基础统计不同基因的外显子长度后,对上述归一化后的多样本基因表达量做基因长度的归一化处理;整理表达矩阵形式(首行为列信息标注,首列为基因名,table分隔的文本文件)36、2)基于单细胞转录组对混池转录组样本完成细胞占比解构的工具有很多种,如cibersortx、bayesprism、aric和其他方法。此处,以cibersortx在线工具为例进行阐述说明。样本混池转录组表达数据cibersortx提交和出结果:登录网页https://cibersortx.stanford.edu/进行在线细胞组成分解。其中,选择分析模块“impute cellfractions”,设置“s-mode batch correction”和“disable quantile normalization”,其他参数保持默认,提交对应文件后,10-30min后即可下载获取细胞组成信息。37、根据本发明的实施例,所述细胞类型特异性基因包括表1所示的至少之一的特征性基因。38、在本发明的另一个方面,本发明提出了一种训练机器学习模型的方法。根据本发明的实施例,所述方法包括:获取训练样本,所述训练样本由多个已知预后结果的样本构成;获取所述训练样本的下咽癌组织的细胞组成信息;采用所述细胞组成信息作为输入特征,所述已知预后结果作为训练标签,对机器学习模型进行训练,以便获得经过训练的机器学习模型。39、在本发明的另一个方面,本发明提出了一种训练机器学习模型的方法。根据本发明的实施例,所述方法包括:获取训练样本,所述训练样本由多个已知联合治疗疗效结果的样本构成;获取所述训练样本的下咽癌组织的细胞组成信息;采用所述细胞组成信息作为输入特征,所述已知联合治疗疗效结果作为训练标签,对机器学习模型进行训练,以便获得经过训练的机器学习模型。40、在本发明的另一个方面,本发明提出了一种计算机设备。根据本发明的实施例,所述设备包括:存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现前面所述的方法的步骤。41、本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。当前第1页12当前第1页12
技术特征:

1.一种对下咽癌进行分类的装置,其特征在于,包括:

2.根据权利要求1所述的装置,其特征在于,所述机器学习模型包括选自回归算法、支持向量机、决策树、随机森林和以神经网络为基础的深度机器学习算法的至少之一。

3.根据权利要求1所述的装置,其特征在于,所述细胞组成信息包括促进肿瘤发展的细胞和抑制肿瘤发展的细胞至少之一的数量信息,

4.根据权利要求1所述的装置,其特征在于,所述细胞组成信息包括所述各细胞类型的比例。

5.根据权利要求1所述的装置,其特征在于,所述下咽癌组织的测序结果是通过混池转录组测序获得的。

6.根据权利要求1所述的装置,其特征在于,所述细胞类型判断标准包括细胞类型特异性基因、细胞类型特异性表达谱。

7.根据权利要求1所述的装置,其特征在于,所述细胞组成信息是通过下列步骤确定的:

8.根据权利要求6所述的装置,其特征在于,所述细胞类型特异性基因包括表1所示的至少之一的特征性基因。

9.一种对下咽癌进行分类的方法,其特征在于,包括:

10.根据权利要求9所述的方法,其特征在于,所述判别模型包括选自回归算法、支持向量机、决策树、随机森林和以神经网络为基础的深度机器学习算法的至少之一;

11.根据权利要求9所述的方法,其特征在于,所述细胞组成信息是通过下列步骤确定的:

12.根据权利要求9所述的方法,其特征在于,所述细胞类型特异性基因包括表1所示的至少之一的特征性基因。

13.一种训练机器学习模型的方法,其特征在于,包括:

14.一种计算机设备,其特征在于,包括:存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求9-12或权利要求13中任一项所述的方法的步骤。


技术总结
本发明提出了一种对下咽癌进行分类的装置,包括获取模块,用于获取下咽癌组织的细胞组成信息;和判断模块,用于将所述细胞组成信息输入至经过训练的机器学习模型,以便获得所述下咽癌的联合治疗疗效预测结果,其中,所述获取模块进一步包括:测序模块,用于获取所述下咽癌组织的混池转录组测序结果;和分析模块,用于基于所述测序结果和预先确定的细胞类型判断标准,确定所述下咽癌组织的所述细胞组成信息,所述细胞类型判断标准是通过单细胞转录组测序确定的。该装置对晚期下咽癌患者联合治疗响应有良好的预测能力,有潜在的临床应用价值。

技术研发人员:谢震,刘淦,陶敏珍,张洋,黄志刚
受保护的技术使用者:清华大学
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1152954.html

最新回复(0)