一种合成D-泛解酸的酶催化剂和方法与流程

专利检索2025-05-16  20


本发明属于生物工程,具体涉及一种全新的、用于合成d-泛解酸生物催化剂和方法。


背景技术:

1、d-泛解酸是一种重要的原料药中间体,在酸性条件下可自发环化形成d-泛解酸内酯,是用于维生素b5,d-泛解酸钙等药物合成的主要原料。d-泛解酸的合成有化学法和酶法,但均存在制备过程繁琐,成本高,效率低,而且原料毒性较大、成本高、废水不易处理的问题。现有的化学法合成泛解酸是以d和l构型的泛解酸内酯混旋物作为底物,需要通过繁琐的化学工艺和大量的有机溶剂进行拆分,仅一半构型的化合物能用于目标产物的纯化,成本高且不环保。现有酶法采用的是通过水解酶将混旋的dl-泛解酸内酯中的d-泛解酸内酯选择性的水解成d-泛解酸,从而达到d和l构型产物的分离。其过程复杂,效率低,产品比旋低,成本高,并需用毒性较高的氰化钠,废水不易处理,不适合产业化。

2、本发明公开了一种全新的d-泛解酸酶法合成路径。解决了现有技术存在的工艺繁琐,效率低,成本高,产业化后会造成环境污染等问题。

3、本发明以酮泛解酸为底物,该底物在酮还原酶(keto reductase,简称kred)或酮泛解酸还原酶(ketopantoate reductase,简称kpr)的催化下发生不对称还原反应生成目标手性产物d-泛解酸。所述反应在ph6.0-9.0、温度为20-60℃的水相磷酸缓冲液或三乙醇胺缓冲液溶液中进行。采用本发明的酶法路径制备d-泛解酸,其产物手性纯度极高,且操作简单,转化率高,反应条件温和,污染少。

4、在反应机理上,酮还原酶或酮泛解酸还原酶通过辅因子nadh或nadph提供的还原力h将羰基(或酮基)化合物催化还原成醇类化合物,同时辅因子nadh或nadph被分别转化为nad+或nadp+。然而由于辅因子nadh或nadph价格昂贵而导致生产成本很高,目前工业界通常采用更有成本优势的辅因子循环体系。即在这个反应过程进行的同时,也可以通过另外一个酶促反应将nad+或nadp+分别转化为nadh或nadph,即完成对nadh或nadph的循环再生。

5、本技术用甲酸脱氢酶(formate dehydrogenase,简称fdh),以甲酸为底物,将辅酶因子nad+循环为nadh,所产生的产物为co2,无固废产物生成;传统的葡萄糖脱氢酶(glucosedehydrogenase,简称gdh)以葡萄糖为底物将辅酶因子nad+循环为nadh的同时所产生的葡萄糖酸为工业固废;本技术提供的技术方案消除了固废的生成,开创了更为环保的酶法合成途径。

6、在酮还原酶或酮泛解酸还原酶将酮泛解酸催化反应生成目标手性产物d-泛解酸的过程中,在上述提及的成本以及环保问题之外,最关键的是还原酶催化底物转化为目标产物的能力。然而可用于上述反应的还原酶来源较少、催化活性往往不能满足工业生产的需要,限制了在工业上的大规模应用。

7、本技术提供的经定向进化改造后的工程化酮还原酶多肽与seq id no:2对应的野生型的酮还原酶相比,具有更好的活性和稳定性,能够以极高的立体选择性不对称地、特别是更高效地催化酮泛解酸转化为d-泛解酸,并已可用于工业化生产。


技术实现思路

1、1.概论

2、本发明提供了一种立体选择性高、催化活性高、稳定性好、底物耐受性高的工程化酮还原酶多肽,能够用于制备手性产物d-泛解酸。还提供了工程化酮还原酶多肽的基因,含有该基因的重组表达载体,工程菌株及其高效制备方法,以及使用工程化酮还原酶多肽制备d-泛解酸的反应工艺。

3、在一些实施方案中,本公开内容中改进的酮还原酶多肽能够以大于seq id no:2的活性将酮泛解酸还原生成d-泛解酸。本发明提供的改进的工程化酮还原酶多肽与seq idno:2对应的野生型的酮还原酶相比,具有更高的活性、稳定性和底物耐受性,能够更高效地催化酮泛解酸还原生成d-泛解酸;在高底物浓度下,本发明提供的改进的工程化酮还原酶多肽仍然能够不被抑制地催化将酮泛解酸还原生成d-泛解酸。这些改进的酮还原酶多肽可包括在对应以下的残基位置与seq id no:2序列相比的一个或多个残基差异的氨基酸序列:x8,x11,x28,x30,x37,x38,x70,x74,x96,x124,x132,x240,x254,x270。改进的酮还原酶多肽包括包含以下特征至少之一的氨基酸序列:c8p,l11m,g28a,l30t,c37f,s38p,t70c,w74p,w74f,i96m,r124h,r124q,r124s,r124k,r124n,v132k,v132t,e240d,h254r,h254p,h254k,h254e,a270v;或同时在这些差异的基础上,包含一个或更多个氨基酸残基的插入或缺失。

4、更具体的,在一些实施方案中,在seq id no:2基础上改进的工程化酮还原酶多肽包括对应seq id no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124所示氨基酸序列组成的多肽。

5、在一些实施方案中,改进的工程化酮还原酶多肽包括与seq id no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124的参考序列至少97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,酮还原酶多肽催化酮泛解酸生成d-泛解酸,所述多肽包括具有与参考序列seq id no:2至少97%的序列同一性和与seq id no:2相比在残基位置132、254上的至少一个残基差异的氨基酸序列,其中,在残基位置132上的氨基酸残基选自k,在残基位置254上的氨基酸残基选自p,所述多肽具有高的活性、稳定性和底物耐受性,且产物ee值至少99%。

6、两条氨基酸序列或两条核苷酸序列之间的同一性均可通过本领域常用的算法得到,可采用ncbi blastp和blastn软件根据默认参数计算得到,也可采用采用clustal w算法(nucleic acid research,22(22):4673-4680,1994)。

7、在另一方面,本发明提供了编码工程化酮还原酶多肽的多核苷酸序列。在一些实施方案中,多核苷酸可以是具有用于表达工程化酮还原酶多肽的一种或多种控制序列的表达载体的部分。在一些实施方案中,多核苷酸可包括对应seq id no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123所示序列的多核苷酸序列。

8、如本领域技术人员所知,由于核苷酸密码子的简并性,编码seq id no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124的氨基酸序列的多核苷酸序列不仅仅局限于seq id no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123。本发明的酮还原酶基因的核酸序列也可以是编码序列表中seq idno:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124所示氨基酸序列的其他任何核酸序列。

9、在另一方面,本公开内容提供包含编码工程化酮还原酶的多核苷酸或能够表达工程化酮还原酶的表达载体和宿主细胞。在一些实施方案中,宿主细胞可以是细菌宿主细胞,比如大肠杆菌。宿主细胞可用于表达和分离本文所述的工程化酮还原酶,或可选地直接用于反应转化底物为产物。

10、在一些实施方案中,以完整细胞、粗提取物、分离的多肽或纯化的多肽形式的工程化酮还原酶可单独使用,或以固定化形式(比如固定在树脂上)使用。

11、如图1所示,本文所述的改进的工程化酮还原酶多肽,在辅因子nadh存在下,可将酮泛解酸还原生成d-泛解酸。在反应中同时添加甲酸脱氢酶(formate dehydrogenase,简称fdh)和甲酸,在甲酸脱氢酶催化甲酸转化为二氧化碳的过程中,将nad+或nadp+分别转化为nadh或nadph。

12、2.详述

13、2.1定义

14、关于本公开内容,除非另外明确定义,否则本文说明书中使用的技术术语和科学术语具有本领域普通技术人员通常理解的含义。

15、“蛋白”、“多肽”和“肽”在本文可互换使用,表示由酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(如,糖基化、磷酸化、脂质化、豆蔻酰化、泛素化等等)。该定义包括d-氨基酸和l-氨基酸、以及d-氨基酸和l-氨基酸的混合物。

16、“工程化酮还原酶”、“工程化酮还原酶多肽”、“改进的酮还原酶多肽”和“工程化多肽”在本文可互换使用。

17、酮还原酶或酮泛解酸还原酶在本文可以互换使用。

18、酮泛解酸或酮基泛解酸在本文可以互换使用。

19、酮泛解酸钠或酮基泛解酸钠在本文可以互换使用。

20、“多核苷酸”和“核酸”在本文可互换使用。

21、如本文使用的“辅因子”指在催化反应中与酶联合起作用的非蛋白化合物。如本文使用的,“辅因子”包括nadh(nicotinamide adenine dinucleotide)或nadph(nicotinamide adenine dinucleotide phosphate)以及其氧化形态nad+或nadp+,其有时也被称作辅酶。

22、“编码序列”指编码蛋白的氨基酸序列的核酸部分(例如,基因)。

23、“天然存在的”或“野生型”是指在自然界发现的形式。例如,天然存在的或野生型的多肽或多核苷酸序列是存在于生物体中、可分离自自然界中的来源且未通过人工操作有意地修饰的序列。

24、“重组的”或“工程化的”或“非天然存在的”当用于指例如细胞、核酸或多肽时,是指如下材料或与该材料的天然形式或固有形式相对应的材料:所述材料以自然界中不会存在的方式被改变,或与其相同但是从合成材料和/或通过使用重组技术操作而产生或获取。

25、“序列同一性”和“同源性”在本文可互换地用于指多核苷酸之间或多肽之间的对比(“序列同一性”和“同源性”通常以百分比的形式来表示),且通过在比较窗口上比较两个最佳对齐的序列来确定,其中多核苷酸或多肽序列在比较窗口中的部分与参照序列相比可包括添加或缺失(即,空位),用于两个序列的最佳对齐。百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基的位置数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中位置总数并将结果乘以100以得到序列同一性百分比。可选地,该百分比可通过以下计算:确定相同核酸碱基或氨基酸残基在两个序列中都存在的位置数或核酸碱基或氨基酸残基与空位对齐的位置数以得到匹配位置数,将该匹配位置数除以比较窗口中的位置总数,并将结果乘以100以得到序列同一性的百分比。本领域技术人员将认识到,存在许多可用于比对两个序列的建立的算法。用于比较的序列最佳比对可例如通过smith和waterman,1981,adv.appl.math.2:482的局部同源性算法、通过needleman和wunsch,1970,j.mol.biol.48:443的同源性比对算法,通过pearson和lipman,1988,proc.natl.acad.sci.usa85:2444的相似性搜索方法,通过这些算法的计算机实现(gcgwisconsin软件包中的gap、bestfit、fasta或tfasta)或通过直观检查(一般参见,current protocols in molecular biology,f.m.ausubel等编著,current protocols,greene publishing associates inc.和john wiley&sons,inc.之间的合资企业,(1995年增刊)(ausubel))。适宜于确定序列同一性和序列相似性百分比的算法的实例是blast和blast2.0算法,它们分别描述于altschul等人,1990,j.mol.biol.215:403-410和altschul等,1977,nucleic acids res.3389-3402中。用于执行blast分析的软件是通过美国国家生物技术信息中心(national center for biotechnology information)网站公开可用的。该算法包括首先通过鉴定查询序列中长度w的短字来鉴定高评分序列对(hsp),所述短字与数据库序列中相同长度的字比对时匹配或满足一些正值的阀值得分t。t被称作邻近字评分阈值(altschul等,如上述)。这些初始相邻字匹配(word hit)充当用于启始搜索的种子来寻找包含它们的更长的hsp。然后字匹配沿着每个序列在两个方向延伸到累积比对得分不能够增加的程度。对于核苷酸序列,累积得分使用参数m(对于匹配残基对的奖励得分;永远>0)和n(对于错配残基的惩罚得分;永远<0)计算。对于氨基酸序列,得分矩阵被用于计算累计得分。当以下情况时,每个方向中的字匹配字串的延伸被终止:累积比对得分从其最大达到值下降了量x;由于累积一个或多个负得分残基比对,累积得分达到0或以下;或到达任一序列末端。blast算法参数w、t和x决定比对的灵敏度和速度。blastn程序(用于核苷酸序列)使用字长(w)11、期望值(e)10、m=5、n=-4以及两链的比较作为默认值。对于氨基酸序列,blastp程序使用以下作为缺省值:字长(w)为3,期望值(e)为10和blosum62得分矩阵(见henikoff和henikoff,1989,proc natl acad sci usa89:10915)。序列比对和序列同一性%的示例性确定可使用gcg wisconsin软件包(accelrys,madison wi)中的bestfit或gap程序,使用所提供的缺省参数。

26、“参考序列”是指用作序列比较的基础的限定序列。参考序列可以是较大序列的子集,例如,全长基因或多肽序列的片段。一般而言,参考序列为至少20个核苷酸或氨基酸残基长,至少25个残基长,至少50个残基长,或者核酸或多肽的全长。因为两种多核苷酸或多肽可以各自(1)包括在两种序列之间相似的序列(即,完整序列的一部分),且(2)可以进一步包括在两种序列之间不同的序列,两种(或更多)多核苷酸或多肽之间的序列比较通常通过在“比较窗口”内比较两种多核苷酸或多肽的序列来进行以鉴定和比较序列相似性的局部区域。在一些实施方案中,“参照序列”不意为限于野生型序列,且可包括工程化或改变的序列。例如,“在对应于x28的残基处具有丙氨酸的基于seq id no:2的参考序列”指其中在seq id no:2中的x28处相应的残基(是甘氨酸)已经改变成丙氨酸的参考序列。

27、“比较窗口”指至少约20个相邻核苷酸位置或者氨基酸残基的概念性片段,其中序列可以与至少20个相邻核苷酸或氨基酸的参考序列相比较,并且其中比较窗口中的序列的部分可以包括与参考序列(其不包括添加或缺失)相比20%或更少的添加或缺失(即,空位),用于两序列的最佳比对。比较窗口可以长于20个相邻残基,并且包括任选地30、40、50、100或更长的窗口。

28、在用于指定的氨基酸或多核苷酸序列的编号的情况下,"相应于"、"参考于"或"相对于"指当指定的氨基酸或多核苷酸序列与参考序列相比较时指定的参考序列残基的编号。换言之,给定序列的残基编号或残基位置是根据参考序列指定的,而不是给定氨基酸或多核苷酸序列内的残基的实际数字位置指定的。例如,可以将给定的氨基酸序列诸如工程化酮还原酶的氨基酸序列与参考序列进行比对,这是通过引入空位以优化这两条序列之间的残基匹配而实现的。在这些情况下,虽然存在空位,但是给定氨基酸或多核苷酸序列中的残基编号相对于已与其比对的参考序列制定。

29、“氨基酸差异”或“残基差异”指在多肽序列的一个位置处氨基酸残基相对于参考序列中相应位置处的氨基酸残基的差异。本文中氨基酸差异的位置一般被称为“xn”,其中n指残基差异基于其的参考序列中的相应位置。例如,“与seq id no:2相比在位置x28处的残基差异”指在相应于seq id no:2的位置28的多肽位置处的氨基酸残基的差异。因此,如果seq id no:2的参考多肽在位置28处具有甘氨酸,那么“与seq id no:2相比在位置x28处的残基差异”是指在相应于seq id no:2的位置28的多肽位置处除了甘氨酸之外的任何残基的氨基酸取代。在本文的大多数实例中,在一个位置处的特定氨基酸残基差异表示为“xny”,其中“xn”指如以上描述的对应位置,并且“y”为在工程化多肽中发现的氨基酸的一字母标识符(即,与参考多肽中的不同的残基)。在一些实例中(例如,在表1中),本公开内容还提供由常规符号“anb”表示的特定氨基酸差异,其中a为参考序列中的残基的一字母标识符,“n”为在参考序列中的残基位置的编号,并且b为工程化多肽的序列中残基取代的单字母标识符。在一些实例中,本公开内容的多肽可包含相对于参考序列的一个或更多个氨基酸残基差异,其通过相对于参考序列存在残基差异处的特定位置的列表表示。

30、“缺失”指通过从参考多肽去除一个或更多个氨基酸而对多肽的修饰。缺失可以包括除去1个或多个、2个或多个氨基酸,5个或多个氨基酸,10个或多个氨基酸,15个或多个氨基酸,或20个或多个氨基酸,多达组成参照酶的氨基酸总数的10%,或多达组成参照酶的氨基酸总数的20%,同时保留工程化酮还原酶的酶活性和/或保留工程化酮还原酶的改进的性质。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段或者可以是不连续的。

31、"插入"指通过从参考多肽添加一个或多个氨基酸的多肽的修饰。在一些实施方案中,改进的工程化酮还原酶包括一个或更多个氨基酸插入天然存在的酮还原酶多肽,以及一个或更多个氨基酸插入其他改进的酮还原酶多肽。可在多肽的内部部分插入,或插入到羧基或氨基末端。如本文所用的,插入包括本领域中已知的融合蛋白。插入可以是氨基酸的连续区段,或者被在天然存在的多肽中一个或更多个氨基酸分隔。

32、“分离的多肽”是指如下多肽:所述多肽基本上与其天然伴随的其他物质例如蛋白、脂质和多核苷酸分离。该术语包括已从其天然存在的环境或表达系统(例如,宿主细胞或体外合成中)移去或纯化的多肽。改进的酮还原酶多肽可以存在于细胞内、存在于细胞培养基中或者以各种形式制备,诸如裂解物或分离的制备物。像这样,在一些实施方案中,改进的酮还原酶多肽可以是分离的多肽。

33、“手性中心”是指连接四个不同基团的碳原子。

34、“立体选择性”(stereoselectivity)指在化学或酶促反应中一种立体异构体相对于另一种或多种异构体的优先形成。立体选择性可以是部分的,其中一种立体异构体的形成优于另一种异构体;或可以是完全的,其中仅形成一种立体异构体。当立体异构体是对映异构体时(enantiomers),立体选择性被称为对映异构体选择性(enantioselectivity),一种对映异构体在两种对映异构体的混合物之中的过量分数(通常被报告为百分比)通常被可选地报告为“对映异构体过量”(enantiomeric excess,简称为ee)。在本领域内该分数(典型地为百分比)通常可选择地报道为根据下式从中计算的对映异构体过量(enantiomeric excess,即ee):{主要对映异构体浓度–次要对映异构体浓度}/{主要对映异构体浓度+次要对映异构体浓度}。

35、“立体异构体”、“立体异构形式”和类似表述在本文可互换使用,是指分子差异仅在其原子在空间中的方位不同所造成的所有异构体。其包括对映异构体和具有多于一个手性中心、且彼此不是镜像的化合物的异构体(即“非对映异构体”)。

36、“转化”指底物向相应的产物的酶转化。“转化百分比”或“转化率”是指在指定反应条件下在指定的反应时间内,反应体系中被转化为产物的底物的百分比。因此,酮还原酶多肽的“酶活性”或“活性”可以被表示为底物向产物的“转化百分比”。转化率一般通过取样来测定反应体系中的产物浓度和底物浓度来计算:{产物摩尔浓度}/{底物摩尔浓度+产物摩尔浓度}。

37、2.2改进的工程化酮还原酶

38、以下表1举例说明本发明所开发的工程化酮还原酶多肽。每一行给出一个具体的工程化酮还原酶多肽的核苷酸序列编号和氨基酸序列编号,以及与seq id no:2相比较的残基差异。每个举例的工程化酮还原酶多肽在不同反应条件下的催化性能。

39、表1

40、

41、

42、

43、

44、注:表1中催化活性倍数是指工程化酮还原酶与seq id no:2在反应条件i和反应条件ii下所得到的转化率的比值。表1中工程化酮还原酶催化生成的d-泛解酸,其ee值均不低于99%。

45、检测催化性能倍数i的反应条件1:酶浓度2.5g/l;酮基泛解酸钠浓度10g/l;nad+浓度0.5g/l;缓冲液浓度0.4m pb;葡萄糖浓度50g/l;gdh(源自bacillus megaterium)酶粉浓度1g/l;反应初始ph7.5;反应温度40℃;反应时间12h;

46、检测催化性能倍数ii的反应条件2:酶浓度2.5g/l;酮基泛解酸钠浓度100g/l;nad+浓度0.5g/l;缓冲液浓度0.1m pb;甲酸铵浓度90g/l;fdh(源自pseudomonas sp.)酶粉浓度10g/l;反应初始ph6;反应温度40℃;反应时间12h;

47、2.3可用于制备工程化酮还原酶多肽的多核苷酸、控制序列、表达载体和宿主细胞

48、在另一方面,本公开内容提供了编码本文描述的具有酮还原酶活性的工程化多肽的多核苷酸。多核苷酸可与控制基因表达的一种或多种异源调控序列可操作地连接以产生能够表达多肽的重组多核苷酸。包含编码工程化的酮还原酶的异源多核苷酸的表达构建体可被引入合适的宿主细胞以表达相应的工程化酮还原酶多肽。

49、如对本领域技术人员明显的是,蛋白序列的可得性和相应于多种氨基酸的密码子的知识提供能够编码目标蛋白序列的所有多核苷酸的说明。其中相同氨基酸由可选择的或同义密码子编码的遗传密码的简并性允许产生极大数目的核酸,所有这些核酸编码本文公开的改进的酮还原酶多肽。因此,确定特定的氨基酸序列后,本领域的技术人员可以以不改变蛋白质的氨基酸序列的方式通过仅仅修饰一个或多个密码子的序列来产生任何数目的不同的核酸。在这点上,本公开内容特别地构思了可通过基于可能的密码子选取而选择组合来制备的多核苷酸的各个和每个可能的改变,并且对于本文公开的任何多肽,包括在表1中提供的示例性工程化多肽的氨基酸序列。

50、在多种实施方案中,密码子被优选地选择以适应在其中产生蛋白的宿主细胞。例如,用于细菌的优选密码子用于表达细菌中的基因;用于酵母中的优选密码子用于在酵母中表达;且用于哺乳动物的优选密码子用于在哺乳动物细胞中表达。

51、在一些实施方案中,所述多核苷酸编码包含与选自seq id no:4-124的偶数序列标识符的参考序列至少约97%、98%、99%或更多序列同一性的氨基酸序列的酮还原酶多肽,其中所述多肽具有酮还原酶活性以及本文描述的改进的特性中的一种或更多种,例如以与seq id no:2的多肽相比增加的活性将底物转化成产物的能力。

52、在一些实施方案中,编码工程化酮还原酶多肽的多核苷酸包含选自seq id no:3-123的奇数序列标识符的序列。

53、在一些实施方案中,所述多核苷酸编码本文所述的多肽,但是在核苷酸水平上与编码工程化酮还原酶的参考多核苷酸具有约50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一些实施方案中,参考多核苷酸序列选自具有seq id no:3-123的奇数序列标识符的序列。

54、编码工程化酮还原酶多肽的分离的多核苷酸可以多种方法被操作以提供多肽的表达,所述方法包括通过密码子优化来进一步改变序列以改进表达、在合适的有或无另外的控制序列的表达元件中插入、和转化入适于表达并产生多肽的宿主细胞。

55、取决于表达载体,在分离的多核苷酸插入载体之前对分离的多核苷酸的操作可以是期望的或必需的。利用重组dna方法修饰多核苷酸和核酸序列的技术在本领域中是公知的。在以下中提供了指导:sambrook等人,2001,molecular cloning:a laboratorymanual,第三版,cold spring harbor laboratory press;和current protocols inmolecular biology,ausubel.f.编著,greenepub.associates,1998,2010年更新。

56、在另一个方面,本公开还涉及重组表达载体,根据它们将被导入的宿主的类型,其包括编码工程化酮还原酶多肽或其变体的多核苷酸,和一个或多个表达调节区,诸如启动子和终止子、复制起点等等。可选地,本公开内容的核酸序列可以通过使核酸序列或包括该序列的核酸构建体插入到适当的表达载体中来表达。在产生表达载体时,编码序列位于载体中以使编码序列被可操作地连接于用于表达的合适的控制序列上。

57、重组表达载体可为任何载体(例如,质粒或病毒),其可方便地应用于重组dna步骤中并且可带来多核苷酸序列的表达。载体的选择通常将取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性或闭合环状的质粒。表达载体可以是自主复制的载体,即作为染色体外的实体而存在的载体,它的复制独立于染色体的复制,如质粒、染色体外的元件、微小染色体、或人工染色体。载体可以包含用于保证自我复制的任何工具。可选地,载体可以是在被引入到宿主细胞中时整合到基因组中并且与其所整合到的染色体一起复制的载体。而且,可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总dna的两种或多种载体或质粒。

58、对本公开内容的实施方案有用的很多表达载体是商业上可得的。示例性表达载体可通过将编码改进的酮还原酶多肽的多核苷酸可操作地连接到质粒pacyc-duet-1(novagen)中来制备。

59、在另一方面,本公开内容提供包含编码本公开内容的改进的酮还原酶多肽的多核苷酸的宿主细胞,所述多核苷酸被可操作地连接至在宿主细胞中用于酮还原酶的表达的一个或更多个控制序列。用于表达由本公开内容的表达载体编码的多肽的宿主细胞在本领域是公知的,并且包括但不局限于诸如大肠杆菌、节杆菌属种knk168、链霉菌属和鼠伤寒沙门氏菌(salmonella typhimurium)细胞的细菌细胞;诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤氏酵母(pichia pastoris))的真菌细胞;诸如果蝇s2以及灰翅夜蛾(spodoptera)sf9细胞的昆虫细胞;诸如cho、cos、bhk、293和bowes黑色素瘤细胞的动物细胞;以及植物细胞。示例性的宿主细胞为大肠杆菌bl21(de3)。上述宿主细胞可以是野生型的,也可以是经过基因组编辑的工程细胞,比如把宿主细胞基因组中所携带的野生型的酮还原酶基因敲除。上述宿主细胞的合适的培养基以及生长条件在本领域内是公知的。

60、用于表达酮还原酶的多核苷酸可通过本领域已知的多种方法被引入至细胞。技术包括,除了其他以外,电穿孔、生物颗粒轰击法、脂质体介导的转染、氯化钙转染和原生质体融合。将多核苷酸引入细胞的不同方法对于本领域技术人员是明显的。

61、2.4产生工程化酮还原酶多肽的方法

62、当工程化多肽的序列为已知时,编码多肽的多核苷酸可根据已知的合成方法通过标准的固相方法制备。在一些实施方案中,多达约100个碱基的片段可单独地合成,然后连接(例如,通过酶促或化学的连接方法或聚合酶介导的方法)以形成任何需要的连续序列。例如,本公开内容的多核苷酸和寡核苷酸可通过化学合成制备,使用,例如,描述于beaucage等人,1981,tetlett22:1859-69的经典的亚磷酰胺方法,或描述于matthes等人,1984,emboj.3:801-05的方法,例如,如在自动化合成方法中典型地实践的。根据亚磷酰胺方法,寡核苷酸在例如,在自动化dna合成仪中合成、纯化、退火、连接以及克隆至合适的载体中。另外,基本上任何核酸可从多种商业来源的任一个获得。

63、在一些实施方案中,本公开内容还提供了用于制备或制作工程化酮还原酶多肽的方法,其中该方法包括在适于表达多肽的培养条件下培养能够表达编码工程化多肽的多核苷酸的宿主细胞。在一些实施方案中,制备多肽的方法还包括分离多肽。工程化多肽可在合适的细胞中表达,并利用所熟知的用于蛋白纯化的技术中的任何一种或更多种从宿主细胞和/或培养基分离(或回收),所述用于蛋白纯化的技术包括,除了其他以外,溶菌酶处理、超声、过滤、盐析、超速离心和色谱。

64、2.5利用工程化酮还原酶的方法以及用其制备的化合物

65、在另一方面,本文所述的改进的工程化酮还原酶多肽(kred),在辅因子nadh存在下,可将酮泛解酸转化为d-泛解酸。d-泛解酸在酸性条件下(ph≤2.0)可自发成环,形成d-泛解酸内酯。

66、

67、本公开内容中改进的酮还原酶多肽能够以大于seq id no:2的活性将酮泛解酸不对称还原生成d-泛解酸。本发明提供的改进的工程化酮还原酶多肽与seq id no:2对应的野生型的酮还原酶相比,具有更高的活性、稳定性以及底物耐受性,能够更高效地催化酮泛解酸不对称还原生成d-泛解酸;或者在高底物浓度下,本发明提供的改进的工程化酮还原酶多肽仍然能够不被抑制地催化酮泛解酸不对称还原生成d-泛解酸。这些改进的酮还原酶多肽可包括在对应以下的残基位置与seq id no:2序列相比的一个或多个残基差异的氨基酸序列:x8,x11,x28,x30,x37,x38,x70,x74,x96,x124,x132,x240,x254,x270。改进的酮还原酶多肽包括包含以下特征至少之一的氨基酸序列:c8p,l11m,g28a,l30t,c37f,s38p,t70c,w74p,w74f,i96m,r124h,r124q,r124s,r124k,r124n,v132k,v132t,e240d,h254r,h254p,h254k,h254e,a270v;或同时在这些差异的基础上,包含一个或更多个氨基酸残基的插入或缺失。

68、更具体的,在一些实施方案中,在seq id no:2基础上改进的工程化酮还原酶多肽包括对应seq id no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124所示氨基酸序列组成的多肽。

69、在一些实施方案中,改进的工程化酮还原酶多肽包括与seq id no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124的参考序列至少97%、98%、99%或更多序列同一性的氨基酸序列。


技术特征:

1.一种工程化酮还原酶多肽,催化酮泛解酸还原生成d-泛解酸,且ee值至少99%,所述多肽包括具有与参考序列seq id no:2至少97%的序列同一性和与seq id no:2相比在残基位置132、254上的至少一个残基差异的氨基酸序列,其中,在残基位置132上的氨基酸残基选自k,在残基位置254上的氨基酸残基选自p。

2.根据权利要求1所述的多肽,反应条件包括约1g/l-200g/l的酮泛解酸钠,0.1g/l至10g/l工程化多肽的载量,6.0至9.0的ph,20-60℃的温度。

3.根据权利要求1或2所述的多肽,其中所述多肽的氨基酸序列为seq id no 4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124所示的氨基酸序列。

4.一种通过化学键或物理吸附的方法被固定在固体材质上的多肽,所述多肽选自权利要求1-3任一项所述的酮还原酶多肽。

5.一种多核苷酸,所述多核苷酸编码权利要求1-4任一项的多肽。

6.如权利要求5所述的多核苷酸,其中所述多核苷酸序列为对应seq id no:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123。

7.一种表达载体,所述表达载体包含权利要求5-6所述的多核苷酸。

8.如权利要求7所述的表达载体,所述表达载体包括质粒、粘粒、噬菌体或病毒载体。

9.一种宿主细胞,所述宿主细胞包括权利要求7-8任一项的表达载体,所述宿主细胞优选大肠杆菌(e.coli)。

10.一种酮还原酶多肽的制备方法,其包括如下步骤:培养权利要求9所述的宿主细胞,以及从培养物中获得酮还原酶多肽。

11.一种酮还原酶催化剂,其选自权利要求7-10任一项的培养物,通过从培养物中获得的含酮还原酶多肽的宿主细胞或培养液,或者用其加工的制品;其中,所述制品是指由转化体细胞得到的提取物,通过对提取物中的酮还原酶进行分离或纯化得到的分离产品,或通过固定化转化体细胞及其提取物或提取物的分离产品而得到的固定化制品。

12.一种制备d-泛解酸的方法:

13.如权利要求12所述的方法,其中所述反应条件包括20℃至60℃的温度。

14.如权利要求12所述的方法,其中所述反应条件包括ph6.0至ph9.0。

15.如权利要求12所述的方法,其中所述底物以1g/l至200g/l的载量存在。


技术总结
本申请提供了一种D‑泛解酸的合成方法,使用定向进化改造后的工程化酮还原酶多肽作为催化剂,该多肽立体选择性高、催化活性高、底物耐受性好,开创了更为环保的酶法合成路线,并且降低了工业生产成本。

技术研发人员:张迎新,章兆琪,赵苏安,蔡冰钦,陈承,许俊鹏,张城孝,陈海滨
受保护的技术使用者:宁波酶赛生物工程有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1153708.html

最新回复(0)