蛋白质多位点组合突变的自动化迭代优化方法与应用

专利检索2025-01-30  35


本发明是关于一种蛋白质多位点组合突变的自动化迭代优化方法与相关应用。


背景技术:

1、蛋白质工程是合成生物学领域的重要研究方向之一。但目前人类对于蛋白质折叠、酶天然进化机制等基础生物学问题的理解仍很有限,因此基于理性设计方法进行蛋白质的功能从头设计(de novo design)仍然是一个难题。定向进化(directed evolution)通过在实验室模拟自然进化的原理,可以在不依赖结构和机制信息的基础上对蛋白质的功能进行有效优化。但是定向进化高度依赖高通量筛选方法,也限制了其对缺少高通量筛选方法的蛋白质进行改造的能力。近年来,人工智能辅助的蛋白质工程逐渐发展成为一种高效的蛋白质分子设计新策略,在蛋白质的结构预测、功能预测、溶解度预测和指导智能文库设计等多个方面显现出独特的优势,成为理性设计和定向进化之后的又一次技术发展的浪潮。

2、机器学习(machine learning)算法为了从标记数据中学习序列-功能关系,已经创建了监督模型来预测各种性质,包括热稳定性、荧光、配体结合亲和力以及催化性能等。虽然取得了概念验证的成功,但当前机器学习算法的性能受到数据稀缺性和偏差的影响。例如,进化采样序列的适应度水平通常在中等范围内,因此标签多样性在低适应度和高适应度范围内受到限制。此外,由于功能分析昂贵且费力,标记的数据通常只覆盖整个序列空间的一小部分。对于含有n个突变位点的蛋白质改造,理论改造空间为20n(例:204=160000),现有的实验水平很难全部构建,当前机器学习指导的蛋白质工程方法试图将实验批次大小和迭代次数保持在尽可能低的水平。


技术实现思路

1、本发明的一个目的在于提供一种改进的蛋白质多位点组合突变的工程改造方法。

2、本发明的另一目的在于提供改进的蛋白质多位点组合突变的工程改造方法的相关应用。

3、一方面,本发明提供了一种蛋白质多位点组合突变的工程改造方法,该方法包括:

4、根据待改造蛋白质的氨基酸序列的n个预设突变位点,将氨基酸序列设分为m段,每段含有至少一个预设突变位点,针对每段氨基酸序列分别构建一组质粒元件,从而构建形成包含m组质粒元件的质粒元件库;其中,n为大于等于2的整数,m为大于等于2的整数,且n≥m;每组质粒元件中分别包括:含有未突变氨基酸序列的编码基因的质粒元件,以及含有定点突变氨基酸序列的编码基因的质粒元件;

5、根据预设的多位点组合突变序列,从每组质粒元件中选取对应的质粒元件,组装构建成多位点组合突变质粒,进而表达蛋白质突变体进行检测。

6、本发明提供的蛋白质多位点组合突变的工程改造方法,可以快速地构建多点组合突变,进而进行功能-序列关系的测试。

7、根据本发明的具体实施方案,本发明的方法中,m段氨基酸序列中,每段序列含有一个预设突变位点。

8、根据本发明的具体实施方案,本发明的方法中,每组质粒元件中分别包括:含有未突变氨基酸序列的编码基因的质粒元件,以及1-19种含有定点突变氨基酸序列的编码基因的质粒元件。所述1-19种分别对应20种常见氨基酸种除未突变氨基酸之外的其他氨基酸。根据本发明的优选实施方案,每组质粒单元中分别包括20种质粒元件,对应预设突变位点的20种氨基酸。所述20种氨基酸即甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸(蛋氨酸)、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、苯丙氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天门冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸这二十种,是组成生命体中的蛋白质的主要单元。

9、根据本发明的具体实施方案,本发明的方法中,质粒元件的构建、多位点组合突变质粒的构建各地独立地利用自动化功能岛完成。

10、根据本发明的具体实施方案,所述自动化功能岛可以是本领域种的现有自动化功能岛,也可以是商购各仪器设备根据本发明的工艺需求进行组装。例如,可以是pct/cn2021/133816中记载的蛋白质自动化工程改造用的功能岛。本发明中将pct/cn2021/133816中记载的内容全部引用于此。利用自动化功能岛完成质粒元件的构建、多位点组合突变质粒的构建,可以快速提供标准、可靠的数据,加速蛋白质迭代优化性能,提高蛋白质工程改造能力。

11、根据本发明的具体实施方案,本发明的方法中,构建质粒元件库的过程包括:

12、针对每段原始氨基酸序列分别构建含有对应编码基因的质粒元件,共构建得到m个含有未突变氨基酸序列的编码基因的质粒元件;

13、以每个所构建的含有未突变氨基酸序列的编码基因的质粒元件为模版,分别在扩增引物中引入突变碱基进行pcr扩增,将原序列质粒元件定点突变成其他氨基酸编码序列,分别构建得到含有定点突变氨基酸序列的编码基因的质粒元件。

14、根据本发明的具体实施方案,本发明的方法中,构建含有未突变氨基酸序列的编码基因的质粒元件的过程是以golden gate组装策略构建质粒元件。具体可包括:自动化pcr中通过自动化移液工作站进行体系的配置,添加到pcr孔板中,机械抓手转移到自动化pcr仪中运行扩增程序。程序完成后移至自动化核酸提取仪中运行dna纯化程序,产物送至自动化移液工作站进行定量和均一化,并进行golden gate组装体系配置,添加到pcr孔板中。将装有组装体系的96孔板送至自动化pcr仪中运行组装程序。进一步地,程序完成送至自动化移液工作站进行宿主细胞(例如大肠杆菌dh5a感受态细胞)的转化,培养箱培养过夜后挑取克隆转接到液体培养基中,并送测序检测。

15、根据本发明的具体实施方案,本发明的方法中,构建含有定点突变氨基酸序列的编码基因的质粒元件的过程包括:以所构建的含有未突变氨基酸序列的编码基因的质粒元件为模版,在扩增引物中引入突变碱基进行pcr扩增,每个质粒模版使用2对引物进行pcr扩增,再通过gbsion assembly组装成新的质粒。自动化pcr、自动化核纯化、自动化组装、自动化转化以及测序流程同含有未突变氨基酸序列的编码基因的质粒元件的构建。

16、根据本发明的具体实施方案,本发明的方法中,预设的多位点组合突变序列为根据机器学习算法推荐的多位点组合突变序列。所述的机器学习算法可以是本领域中任何可行的机器学习算法,预先对蛋白质突变体进行模型预测(包括其空间结构、功能等的模拟预测),提供推荐的多位点组合突变序列。例如,所述的机器学习算法可以是cn115249514a记载的机器学习算法,或是其他机器学习指导的蛋白质工程改造方法的算法。本发明中将cn115249514a中记载的内容全部引用于此。

17、根据本发明的具体实施方案,本发明的方法中,构建多位点组合突变质粒的过程包括:将质粒元件库中的m组质粒元件按顺序排列到孔板中,自动化移液工作站根据预设的多位点组合突变序列选取相应位置的质粒元件到新的孔板中,并添加组装体系中的其他组装成分,利用自动化pcr仪运行组装程序。

18、根据本发明的具体实施方案,本发明的方法中,多位点组合突变质粒进一步被转化到宿主细胞(例如大肠杆菌bl21(de3)感受态细胞)中,培养,挑取克隆转接到培养基中继续培养表达蛋白质突变体,进行检测。

19、根据本发明的具体实施方案,本发明的方法中,所述检测包括:检测蛋白质突变体序列-功能关系。

20、根据本发明的具体实施方案,本发明的方法中,通过高通量maldi质谱进行代谢物的检测,所述代谢物包括蛋白质突变体,从而获得序列-功能关系。优选地,可进一步将检测结果作为机器学习算法新的输入,进行下一轮蛋白质突变体模型预测和序列设计的持续改进,实现蛋白质工程改造的迭代优化。

21、根据本发明的具体实施方案,本发明的蛋白质多位点组合突变的工程改造方法是用于蛋白质多位点组合突变的自动化迭代优化。即,另一方面,本发明还提供了所述的方法在蛋白质多位点组合突变的自动化迭代优化中的应用。

22、在本发明的一些具体实施方案中,适用于本发明的待改造蛋白质可以包括3-20个、进一步优选4-15个、更进一步优选4-10个预设突变位点。

23、在本发明的一些具体实施方案中,待改造蛋白质为鼠李糖脂酰基转移酶(rhla)。在本发明的一些更优选的具体实施方案中,鼠李糖脂酰基转移酶的预设突变位点包括arg74、ala101、leu148、ser173中的一个或多个。

24、在本发明的一些具体实施方案中,组合突变质粒的组装分轮次完成。优选地,每轮次完成48-768个优选96-384个组合突变质粒的构建。

25、在本发明的一些更优选的具体实施方案中,每一轮预测384个组合突变,4-5轮迭代后可以筛选到较佳的组合突变。

26、本发明的方法,通常一轮384个组合突变株构建测试只需要3-5天,机器学习算法可以在4-5轮内筛选到较佳的组合突变,本发明的方法可以在半个月至一个月内完成一个蛋白质工程改造目标。

27、综上所述,本发明提供了一种蛋白质组合突变的自动化迭代优化方法与应用,其中根据需要突变的多位点,以pcr的方法将基因进行分割,并构建到骨架质粒上去,设计定点突变引物,对特定氨基酸位点突变成其他19种氨基酸,构建质粒元件库。根据机器学习算法生成的突变序列,选取质粒元件库中合适的元件构建到骨架质粒上,并转化到大肠杆菌等其他底盘中进行基因的表达,通过高通量maldi质谱进行代谢物的检测,从而获得序列-功能关系。进一步可将检测结果作为算法新的输入,进行模型预测和序列设计的持续改进。本发明的方法中,自动化的组合突变构建测试可以快速为机器学习算法标准、可靠的数据,加速算法迭代优化性能,提高蛋白质工程改造能力。本发明可以快速地构建算法推荐的突变序列,从而在较短的时间内进行迭代优化,更好地指导蛋白质工程改造。


技术特征:

1.一种蛋白质多位点组合突变的工程改造方法,该方法包括:

2.根据权利要求1所述的方法,其中,m段氨基酸序列中,每段序列含有一个预设突变位点;

3.根据权利要求1所述的方法,其中,预设的多位点组合突变序列为根据机器学习算法推荐的多位点组合突变序列。

4.根据权利要求1所述的方法,其中,质粒元件的构建、多位点组合突变质粒的构建各地独立地利用自动化功能岛完成。

5.根据权利要求1-4任一项所述的方法,其中,构建质粒元件库的过程包括:

6.根据权利要求1-5任一项所述的方法,其中,构建多位点组合突变质粒的过程包括:

7.根据权利要求1-6任一项所述的方法,其中,多位点组合突变质粒进一步被转化到宿主细胞中,培养,挑取克隆转接到培养基中继续培养表达蛋白质突变体,进行检测。

8.根据权利要求7所述的方法,其中,所述检测包括:检测蛋白质突变体序列-功能关系。

9.根据权利要求7所述的方法,其中,通过高通量maldi质谱进行代谢物的检测,所述代谢物包括蛋白质突变体,从而获得序列-功能关系;

10.权利要求1-9任一项所述的方法在蛋白质多位点组合突变的自动化迭代优化中的应用;


技术总结
本发明提供了一种蛋白质多位点组合突变的自动化迭代优化方法与应用。本发明首先提供一种蛋白质多位点组合突变的工程改造方法,其包括:根据待改造蛋白质的氨基酸序列的N个预设突变位点,将氨基酸序列设分为M段,每段含有至少一个预设突变位点,针对每段序列分别构建一组质粒元件,从而构建形成包含M组质粒元件的质粒元件库;每组质粒元件中分别包括含有未突变及突变氨基酸序列的编码基因的质粒元件;根据预设的多位点组合突变序列,从每组质粒元件中选取对应的质粒元件,组装构建成多位点组合突变质粒,进而表达蛋白质突变体进行检测。本发明可以快速地构建多点组合突变,并进行功能‑序列关系的测试。

技术研发人员:司同,付立豪,张建志,陈永灿,郭二鹏,谢文豪
受保护的技术使用者:中国科学院深圳先进技术研究院
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1149326.html

最新回复(0)