本发明属于药物开发,特别涉及一种基于遗传多效性的跨疾病治疗靶标预测方法、电子设备、信息平台、存储介质和程序产品
背景技术:
1、计算医学,因其能够快速弥合跨疾病多效性发现和治疗转化应用的差距而日益得到认可。目前,计算医学的发展趋势从人类遗传学研究和药物开发的重点逐渐向转化应用(遗传学发现)、综合性优先排序(及性能评估)和跨疾病分析(基于多表型的人群队列)的转变。
2、早在2007年,全基因组关联研究(gwas)在常见慢性疾病中得到了里程碑式的应用[1]。在经历多年发展之后,人类遗传学研究和药物开发已经进入了“尝试和测试(tryingand testing)”时代。尽管已取得了一定进展,药物损耗率仍然很高,超90%的i期临床候选药物最终无法获批,因此急需降低药物开发中的损耗率、提高新药研发成功概率[2]。在这方面,人类遗传学研究和药物开发发挥了至关重要的作用,尤其是历经三个转折点的后gwas转化医学时代,这三个转折点分别是:
3、第一个转折点,为最重要的转折点。受回顾性分析的结果启发,具有人类遗传学证据支持的药物-靶点对可以提高药物研发成功率[3-5],尤其当药物支持的靶点与疾病有因果关系时,人们可以将对疾病的遗传学知识转化为临床实际应用[6]。
4、第二个转折点,开发综合性的药物靶点优先排序方法,包括使用多模态基因组调控数据集(策略1)和蛋白互作网络知识(策略2)两个策略。调控基因组数据集(策略1)用于解决遗传位点(对常见疾病而言多数位于非编码区域)效应基因及其对应通路的识别难题。非编码位点对效应基因的调控作用通常涉及远程调控机制并具有细胞特异性。这些调控互作信息可从调控数据集中获取,例如启动子捕获hi-c数据可以将长距离物理互作映射到基因启动子上[7-10];表达数量性状位点(eqtl)数据可反映了遗传位点与基因表达之间的关联[11-13]。另一方面,联合人类遗传学和策略2中的蛋白互作信息可识别已知的治疗靶点[14-16]。
5、第三个转折点,为最关键的转折点。借助人群规模的基因组和表型数据(如ukbiobank),实现了从单疾病关联分析到跨疾病分析的转变[17]。疾病联合分析可以促进遗传位点的挖掘,近年来已越发受到研究人员重视,有可能促进遗传学的发现。目前,跨疾病分析已被证明有助于识别共享的遗传位点,且表现为跨疾病的多效性效应。这种跨疾病分析已成功应用于多种疾病的研究,包括精神类疾病[18]、炎症性疾病[19]和自身免疫性疾病[20]。术语“多效性”起源于希腊语“pleio(many)”和“tropic(ways)”,可解释为单个位点或基因影响多种性状。在疾病遗传学中,“多效性遗传位点”则指的是影响多种疾病的共享位点。需要与“多基因位点(polygenic loci)”区分开,后者描述的是多个位点一同影响单个疾病。值得注意的是,多效性通常见于具有不同表型的疾病。这与19世纪孟德尔对豌豆植株遗传规律的研究结果一致,他观察到“种皮颜色”基因影响了明显不相关的性状(例如花和腋的色素沉着)。
6、而表型不同的疾病(如神经精神性疾病)具有相似的致病机制,或许存在通用的治疗策略。识别这些疾病共享的多效性位点及其效应基因和通路,可能对治疗靶点的挖掘具有重要意义。然而,其关键问题在于如何高效地从跨疾病多效性关联数据中识别治疗靶点,用于推动基于人类疾病遗传学和基因组学进行治疗靶点识别的计算医学发展进程。
7、本公开背景技术中涉及的参考文献如下。
8、1.the wellcome trust case control consortium(2007).genome-wideassociation study of 14,000cases of seven common diseases and 3,000sharedcontrols.nature 447,661–678.10.1038/nature05911.
9、2.hay,m.,thomas,d.w.,craighead,j.l.,economides,c.,and rosenthal,j.(2014).clinical development success rates for investigational drugs.natbiotechnol 32,40–51.10.1038/nbt.2786.
10、3.cook,d.,brown,d.,alexander,r.,march,r.,morgan,p.,satterthwaite,g.,and pangalos,m.n.(2014).lessons learned from the fate of astrazeneca’s drugpipeline:a five-dimensional framework.nat rev drug discov 13,419–431.10.1038/nrd4309.
11、4.nelson,m.r.,tipney,h.,painter,j.l.,shen,j.,nicoletti,p.,shen,y.,floratos,a.,sham,p.c.,li,m.j.,wang,j.,et al.(2015).the support of humangenetic evidence for approved drug indications.nat genet 47,856–860.10.1038/ng.3314.
12、5.waring,m.j.,arrowsmith,j.,leach,a.r.,leeson,p.d.,mandrell,s.,owen,r.m.,pairaudeau,g.,pennie,w.d.,pickett,s.d.,wang,j.,et al.(2015).an analysisof the attrition of drug candidates from four major pharmaceuticalcompanies.nat rev drug discov 14,475–486.10.1038/nrd4609.
13、6.king,e.a.,wade davis,j.,and degner,j.f.(2019).are drug targets withgeneticsupport twice as likely to be approved?revised estimates of the impactof geneticsupport for drug mechanisms on the probability of drugapproval.plos genet 15,1–20.10.1371/journal.pgen.1008489.
14、7.martin,p.,ding,j.,duffus,k.,gaddi,v.p.,mcgovern,a.,ray-jones,h.,yarwood,a.,worthington,j.,barton,a.,and orozco,g.(2019).chromatininteractions revealnovel gene targets for drug repositioning in rheumaticdiseases.ann rheum dis 78,1127–1134.10.1136/annrheumdis-2018-214649.
15、8.schoenfelder,s.,and fraser,p.(2019).long-range enhancer–promotercontacts ingene expression control.nat rev genet 20,437–455.10.1038/s41576-019-0128-0.9.jung,i.,schmitt,a.,diao,y.,lee,a.j.,liu,t.,yang,d.,tan,c.,eom,j.,chan,m.,chee,s.,et al.(2019).a compendium of promoter-centered long-rangechromatininteractions in the human genome.nat genet 51,1442–1449.10.1038/s41588-019-0494-8.
16、10.javierre,b.m.,burren,o.s.,wilder,s.p.,kreuzhuber,r.,hill,s.m.,sewitz,s.,cairns,j.,wingett,s.w.,várnai,c.,thiecke,m.j.,et al.(2016).lineage-specificgenome architecture links enhancers and non-coding disease variantsto target genepromoters.cell 167,1369-1384.e19.10.1016/j.cell.2016.09.037.
17、11.u.,claringbould,a.,westra,h.-j.,bonder,m.j.,deelen,p.,zeng,b.,kirsten,h.,saha,a.,kreuzhuber,r.,yazar,s.,et al.(2021).large-scale cis-andtrans-eqtl analyses identify thousands of genetic loci and polygenic scoresthat regulateblood gene expression.nat genet 53,1300–1310.10.1038/s41588-021-00913-z.
18、12.the gtex consortium(2020).the gtex consortium atlas of geneticregulatoryeffects across human tissues.science 369,1318–1330.10.1101/787903.
19、13.kerimov,n.,hayhurst,j.d.,peikova,k.,manning,j.r.,walter,p.,kolberg,l.,m.,sakthivel,m.p.,kuzmin,i.,trevanion,s.j.,et al.(2021).acompendium of uniformly processed human gene expression and splicingquantitativetrait loci.nat genet 53,1290–1299.10.1038/s41588-021-00924-w.
20、14.barrio-hernandez,i.,schwartzentruber,j.,shrivastava,a.,del-toro,n.,zhang,q.,bradley,g.,hermjakob,h.,orchard,s.,dunham,i.,anderson,c.a.,et al.(2023).network expansion of genetic associations defines a pleiotropy map ofhuman cellbiology.nature g 55,389–398.10.1038/s41588-023-01327-9.
21、15.lal,j.c.,mao,c.,zhou,y.,gore-panter,s.r.,rennison,j.h.,lovano,b.s.,castel,l.,shin,j.,gillinov,a.m.,smith,j.d.,et al.(2022).transcriptomics-based networkmedicine approach identifies metformin as a repurposable drugfor atrial fibrillation.cell rep med 3,100749.10.1016/j.xcrm.2022.100749.
22、16.okada,y.,wu,d.,trynka,g.,raj,t.,terao,c.,ikari,k.,kochi,y.,ohmura,k.,suzuki,a.,yoshida,s.,et al.(2014).genetics of rheumatoid arthritiscontributes tobiology and drug discovery.nature 506,376–381.10.1038/nature12873.
23、17.ying,w.(2023).phenomic studies on diseases:potential andchallenges.phenomics 3,285–299.10.1007/s43657-022-00089-4.
24、18.lee,p.h.,anttila,v.,won,h.,feng,y.c.a.,rosenthal,j.,zhu,z.,tucker-drob,e.m.,nivard,m.g.,grotzinger,a.d.,posthuma,d.,et al.(2019).genomicrelationships,novel loci,and pleiotropic mechanisms across eightpsychiatricdisorders.cell 179,1469-1482.e11.10.1016/j.cell.2019.11.020.
25、19.ellinghaus,d.,jostins,l.,spain,s.l.,cortes,a.,bethune,j.,han,b.,park,y.r.,raychaudhuri,s.,pouget,j.g.,hubenthal,m.,et al.(2016).analysis offive chronic inflammatory diseases identifies 27new associations andhighlights disease-specific patterns at shared loci.nat genet 48,510–518.10.1038/ng.3528.
26、20.márquez,a.,kerick,m.,zhernakova,a.,gutierrez-achury,j.,chen,w.m.,onengut-gumuscu,s.,i.,rodriguez-rodriguez,l.,rios-fernández,r.,gonzález-gay,m.a.,et al.(2018).meta-analysis of immunochip data of fourautoimmune diseases reveals novel single-disease and cross-phenotypeassociations.genome med 10,1–13.10.1186/s13073-018-0604-8.
技术实现思路
1、本公开实施例之一,一种遗传多效性驱动的跨疾病治疗靶标预测方法,该方法包括:
2、基于基因组证据识别多效性基因,通过蛋白互作网络证据识别外围基因,得到预测因子;
3、整合基因和预测因子,对全基因组的靶基因进行优先排序;
4、识别介导分子通路间交汇的基因网络,基于子网络进行高级分析,该分析包括基于通路交汇的扰动去除分析、基于通路交汇的网络功能模块分析和基于通路交汇的跨疾病靶点图谱分析,获得跨疾病治疗靶标预测结果。
5、其中,所述基因组证据包括多模态调控基因组数据集。所述的网络证据包括蛋白互作知识。
6、本公开实施例,在计算转化医学研究领域,通过生物信息学工具开发和药物靶标预测,实现了基于遗传多效性的跨疾病治疗靶标预测,解决了从跨疾病多效性关联数据中高效识别治疗靶点,完成特定疾病治疗药物开发的难题。
1.一种跨疾病治疗靶标预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述基因组证据包括多模态调控基因组数据集。
3.根据权利要求1所述的方法,其特征在于,所述的网络证据包括蛋白互作知识。
4.根据权利要求1所述的方法,其特征在于,在所述识别介导分子通路间交汇的基因网络的步骤中,还包括基于子网络进行高级分析,该分析包括基于通路交汇的扰动去除分析、基于通路交汇的网络功能模块分析和基于通路交汇的跨疾病靶点图谱分析。
5.根据权利要求1所述的方法,其特征在于,对所述跨疾病治疗靶标预测方法的性能基准测试包括:定义临床理论支持靶点和模拟阴性对照靶点的第一分析、进行基准测试并衡量不同工具/方法将临床理论支持靶点和模拟对照区分性能的第二分析和/或评估多效性应用于临床治疗靶点识别潜能以及在靶点水平解析疾病之间关联的第三分析。
6.根据权利要求5所述的方法,其特征在于,采用优先排序的先导分析(lpa),将优先排序基因按优先评分高低进行排序,以衡量临床理论支持的治疗靶点富集到先导靶基因上的程度。
7.根据权利要求5所述的方法,其特征在于,采用多效性驱动的临床治疗策略(pict)衡量所述多效性跨疾病治疗靶标预测结果应用于特定疾病临床治疗的潜力。
8.根据权利要求5所述的方法,其特征在于,将每个疾病作为网络中的一个节点,疾病之间的关系作为边,以网络形式形成疾病之间的关联,在靶点水平计算疾病关联性。
9.一种跨疾病治疗靶标预测方法的性能评估方法,其特征在于,对根据权利要求1所述的方法进行预测性能评估分析,包括定义临床理论支持靶点和模拟阴性对照靶点的第一分析、进行基准测试并衡量不同工具/方法将临床理论支持靶点和模拟对照区分性能的第二分析和/或评估多效性应用于临床治疗靶点识别潜能以及在靶点水平解析疾病之间关联的第三分析。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序以实现如权利要求1至8任一项所述的方法。
11.一种跨疾病治疗靶标预测信息平台,其特征在于,所述信息平台包括服务器,服务器具有存储器;以及
12.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1至8中任一所述的方法。
13.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行以实现权利要求1至8任一项所述的方法。