本发明涉及蛋白工程中蛋白定向进化领域,具体而言,涉及一种蛋白定向进化的方法。
背景技术:
1、蛋白定向进化的思路是通过模拟自然进化,对目的基因进行重复多轮的突变、表达和筛选,从而在短时间内完成自然界中需要成千上万年的进化,最终获得性能改进或具有新功能的蛋白质。蛋白定向进化的方法,可分为非理性设计、半理性设计和理性设计3种策略。
2、非理性设计即随机进化策略,优点是不需要对蛋白序列及结构有深入了解,仅需通过随机突变和片段重组的方法模拟自然进化。主要包括易错pcr (error-pronepolymerase chain reaction,eppcr)及dna重组(dna shuffling)。dna shuffling主要用于单基因或多基因的重组,该技术利用dnase将一组带有有义突变位点的同源基因切成随机片段(通常10-50 bp),使用pcr使之延伸重组获得全长基因。优点是操作简单,不需要蛋白结构信息,容易获得有义突变;缺点是要求基因序列间至少具有70%的一致性,由于密码子的兼并性,氨基酸序列的变化是远小于碱基序列的,因此70%一致性的基因序列在蛋白质的氨基酸序列层面则意味着90%以上的一致性,这一致命缺陷导致在近20年中这种技术并未被广泛应用。易错pcr相对来说应用更多些,其基本原理是通过改变pcr反应体系的反应条件或使用低保真的dna聚合蛋白,增加碱基随机错配率,从而造成多点突变,产生序列多样性的突变体文库,因其不需要蛋白结构信息、操作简单而被研究者广泛采用。然而该技术的应用受到以下几方面制约:聚合蛋白的碱基偏好性(通常ag > tc)、突变效率低,每轮突变的碱基一般为1个,通过不断的叠加累计,通常情况下需要至少连续4轮的eppcr逐步积累正向突变,才能获得蛋白性能显著提高的目的突变体。受限于检测通量,一般一轮eppcr的库容量在1000-2000左右。
3、理性设计是一种智能改造手段,依赖计算机技术(in silico)模拟自然界蛋白质的进化轨迹,通过计算机虚拟突变,筛选可快速准确预测目标突变体。通过一系列基于生物信息学开发的算法和程序,预测蛋白质活性位点并考察特定位点突变对其稳定性、折叠及与底物结合等方面的影响,从而对蛋白质进行针对性地改造。基于计算机辅助设计和大尺度的分子动力学模拟可高效、快捷地改造和筛选生物催化剂,不仅可高精度地预测蛋白结构,还可从头设计自然界中不存在的新蛋白。尽管新蛋白设计已取得一定成功,但依然面临诸多挑战:首先,其成功率较低;其次,计算工作繁重,对计算机资源依赖非常高;再次,设计出的新蛋白结构和稳定性较差,催化活性往往偏低。主要是因为对蛋白序列/结构/功能之间关系的认识还不够深入。理性设计一般通过定点突变引入突变位点,库容量在几十到几百之间。
4、半理性设计主要借助生物信息学方法,基于同源蛋白序列比对、三维结构或已有知识,理性选取多个氨基酸残基作为改造靶点,结合有效密码子的理性选用,通过构建高质量突变体文库,有针对性地对蛋白质进行改造。一般通过兼并的引物引入突变,建库的容量在数百到数千之间(曲戈,赵晶,郑平等,定向进化技术的最新进展。生物工程学报,2018,34(1):1-11)。
5、综上可见,在蛋白定向进化中,定点突变和定点饱和突变在突变文库的构建中是使用比例最多的手段,除此之外eppcr也是有效的手段。
6、目前定点突变和定点饱和突变,一般是将突变位点设计成目标碱基或者兼并碱基,由pcr引入,然后构建到质粒上,转化到表达宿主中,多选择大肠杆菌,然后进行培养,转接,诱导表达出目标蛋白,然后再破碎获取蛋白,用粗蛋白提取物或者纯蛋白进行反应。
7、易错pcr的建库容量较大,但是受限于筛选通量,一般易错pcr筛选的突变体在1000-2000左右。对于工业用蛋白来说,蛋白通常氨基酸的个数在300左右之间。每个位点设计3-5条引物,分别将该位点突变为3-5种代表不同的性质的氨基酸,这样的话,易错pcr也可以用全局性pcr进行解决。
8、综上所述,现有的蛋白定向进化的方法基本可以由包含单个突变体的引物实现。由于近年来,基因合成的技术不断突破,基因合成的费用越来越低,一般一条引物大概花费10元左右,合成千条引物的价格也不过在1万元左右,根据现在的发展趋势,在未来这一成本会越来越低。
9、对于传统的蛋白定向进化,从引物设计到突变体的性状检测,需要经过pcr、蛋白切、连接、转化、挑单克隆、单克隆培养、转接、诱导、表达、离心收菌、重悬以及破碎等10余个步骤才能获得目标蛋白的粗细胞提取物,一般需要2-3周左右的时间,这一系列操作不仅费事费力,并且微生物操作会有污染杂菌或者噬菌体的风险,对设备和耗材要求较高,对人员操作要求很高,同时,由于操作流程很长,每一步均会引入少量误差,导致最终结果的波动较大。
技术实现思路
1、本发明的主要目的在于提供一种蛋白定向进化的方法,以解决现有技术中酶定向进化流程长的问题。
2、为了实现上述目的,根据本发明的一个方面,提供了一种蛋白定向进化的方法,该方法包括:通过pcr扩增获得带有目标蛋白的基因突变的pcr产物;将pcr产物置于蛋白体外表达体系中进行基因表达,获得带有突变的目标蛋白;对带有突变的目标蛋白进行性状检测,性状检测包括对目标酶的活性和/或对应异构体过量百分率(即ee值)进行检测;其中,目标蛋白为目标酶;蛋白体外表达体系为大肠杆菌体外表达体系,大肠杆菌体外表达体系包括:基础成分、能量相关成分、添加成分、细胞提取物及rnase抑制剂,其中,在大肠杆菌体外表达体系中,基础成分包括:每种氨基酸的浓度为2mm的19种氨基酸、2mm的酪氨酸、14 mm的醋酸镁、60 mm的醋酸钾及7 mm 的ddt;在大肠杆菌体外表达体系中,能量相关成分包括:1.2 mm amp、0.85 mm cmp、0.85 mm gmp、0.85 mm ump、15~83mm pep、0.4~0.6 mm nad、4mm草酸钾、90 mm谷氨酸钾、2.5~10mm谷氨酸镁;在大肠杆菌体外表达体系中,添加成分包括:1.5 mm亚精胺和157.33 mm hepes;在大肠杆菌体外表达体系中,rnase抑制剂的浓度为150u/450μl;细胞提取物在大肠杆菌体外表达体系中的体积含量为20~60%。
3、进一步地,利用如下任意一种或多种方法,通过pcr扩增获得带有目标蛋白的基因突变的pcr产物:1)通过两步pcr的方法扩增得到带有目标蛋白的基因突变的pcr产物;设计2个引物对:1)f1与r1;2)f2与r2,并在2个引物对中引入含有突变位点的突变序列,利用2个引物对进行第一步pcr,分别pcr出突变位点两边的片段l1和l2,其中,片段l1和l2中间重叠区域记为l,突变位点位于l上;然后以片段l1和l2的混合物作为模板,以f1和r2为引物,进行第二步pcr,获得全长序列,全长序列即为带有目标蛋白的基因突变的pcr产物;或2)根据定点饱和突变的原理,通过pcr扩增引入突变的方法,构建多个带有目标蛋白的基因突变的pcr产物,多个带有目标蛋白的基因突变的pcr产物构建目标蛋白基因的饱和突变体库;或3)通过pcr扩增的方法定点引入突变,从而获得带有目标蛋白的基因突变的pcr产物;或4)利用易错pcr的方法进行全序列随机突变,从而获得多个带有目标蛋白的基因突变的pcr产物,多个带有目标蛋白的基因突变的pcr产物覆盖目标蛋白的基因全序列的随机突变;或5)利用多点突变的方法,获得带有目标蛋白的基因的多个突变位点的pcr产物。
4、进一步地,在大肠杆菌体外表达体系中,pep的浓度为30 mm;优选地,nad 的浓度为0.4 mm;优选地,谷氨酸镁的浓度为7.5 mm;优选地,细胞提取物在大肠杆菌体外表达体系中的体积含量为33.3%。
5、进一步地,目标酶选自如下任意一种工业用蛋白酶。
6、进一步地,工业用蛋白酶为seq id no:1所示的酯蛋白或seq id no:2所示的转氨酶ta-1。
7、进一步地,对带有基因突变的目标酶进行性状检测包括:利用多个带有不同的基因突变的目标酶催化相同底物反应生成相同的产物,检测不同目标酶催化底物的转化率和/或产物的对应异构体过量百分率;以初始对照酶催化底物的转化率和/或异构体过量百分率为参照,从多个目标酶中筛选获得转化率和/或对应异构体过量百分率提升的目标酶,并记为初始+1对照酶。
8、进一步地,在获得初始+1对照酶之后,方法还包括:将初始+1对照酶迭代为初始对照酶,然后重复执行步骤s1至s3,依次类推,从而获得多个定向进化后的目标酶。
9、为了实现上述目的,根据本发明的第二个方面,提供了一种蛋白体外表达体系,该蛋白体外表达体系为大肠杆菌体外表达体系,大肠杆菌体外表达体系包括:基础成分、能量相关成分、添加成分、细胞提取物及rnase抑制剂,其中,在大肠杆菌体外表达体系中,基础成分包括:每种氨基酸的浓度为2mm的19种氨基酸;2mm的酪氨酸;14 mm的醋酸镁;60 mm的醋酸钾及7 mm 的ddt;在大肠杆菌体外表达体系中,能量相关成分包括:1.2 mm amp、0.85mm cmp、0.85 mm gmp、0.85 mm ump、15~83mm pep、0.4~0.6 mm nad、4 mm草酸钾、90 mm谷氨酸钾、2.5~10mm谷氨酸镁;在大肠杆菌体外表达体系中,添加成分包括:1.5 mm亚精胺和157.33 mm hepes;在大肠杆菌体外表达体系中,rnase抑制剂的浓度为150u/450μl;细胞提取物在大肠杆菌体外表达体系中的体积含量为20~60%。
10、进一步地,在大肠杆菌体外表达体系中,pep的浓度为30 mm;优选地,nad 的含量为0.4 mm;
11、优选地,谷氨酸镁的含量为7.5 mm;优选地,细胞提取物在大肠杆菌体外表达体系中的体积含量为33.3%。
12、为了实现上述目的,根据本发明的第三个方面,提供了一种蛋白定向进化的试剂盒,该试剂盒包括蛋白体外表达体系,蛋白体外表达体系为大肠杆菌体外表达体系,大肠杆菌体外表达体系包括:基础成分、能量相关成分、添加成分、细胞提取物及rnase抑制剂,其中,在大肠杆菌体外表达体系中,基础成分包括:每种氨基酸的浓度为2mm的19种氨基酸;2mm的酪氨酸;14 mm的醋酸镁;60 mm的醋酸钾及7 mm 的ddt;在大肠杆菌体外表达体系中,能量相关成分包括:1.2 mm amp、0.85 mm cmp、0.85 mm gmp、0.85 mm ump、15~83mm pep、0.4~0.6 mm nad、4 mm草酸钾、90 mm谷氨酸钾、2.5~10mm谷氨酸镁;在大肠杆菌体外表达体系中,添加成分包括:1.5 mm亚精胺和157.33 mm hepes;在大肠杆菌体外表达体系中,rnase抑制剂的浓度为150u/450μl;细胞提取物在大肠杆菌体外表达体系中的体积含量为20~60%。
13、进一步地,在大肠杆菌体外表达体系中,pep的浓度为30 mm;优选地,nad 的含量为0.4 mm;优选地,谷氨酸镁的含量为7.5 mm;优选地,细胞提取物在大肠杆菌体外表达体系中的体积含量为33.3%。
14、应用本发明的技术方案,通过将pcr引入蛋白突变进化的过程与蛋白体外表达相结合,并直接利用改进的体外表达的蛋白产物进行酶活性和/或对应异构体过量百分率等性能验证和定向进化筛选,通过一系列实验验证发现,该方法所获得的结果与传统的方法所获结果一致,证明了这种改进的蛋白定向进化方法的可行性和有效性。从效率及结果的稳定性角度来看,不仅稳定性高,而且从通常所需的2-3周的时间缩短为7个小时左右,大大加快了进化速度。
1.一种蛋白定向进化的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,利用如下任意一种或多种方法,通过pcr扩增获得带有目标蛋白的基因突变的pcr产物:
3.根据权利要求1所述的方法,其特征在于,在所述大肠杆菌体外表达体系中,所述pep的浓度为30 mm;
4.根据权利要求1所述的方法,其特征在于,所述目标酶选自工业用蛋白酶。
5.根据权利要求4所述的方法,其特征在于,所述工业用蛋白酶为seq id no:1所示的酯蛋白或seq id no:2所示的转氨酶ta-1。
6.根据权利要求1所述的方法,其特征在于,对带有所述基因突变的所述目标酶进行性状检测包括:
7.根据权利要求6所述的方法,其特征在于,在获得所述初始+1对照酶之后,所述方法还包括:将所述初始+1对照酶迭代为所述初始对照酶,然后重复执行所述步骤s1至s3,依次类推,从而获得多个定向进化后的目标酶。