本发明涉及生物,具体涉及一种多顺反子的自放大rna及制备方法。
背景技术:
1、mrna疫苗大致分为非复制性mrna疫苗和自放大rna疫苗。与非复制性mrna疫苗相比,自放大rna(self-amplifying rna,sarna)能够以自身的rna序列为模板,进行自我复制。较低剂量的sarna可以实现相似的免疫原蛋白表达水平和对病毒的同等保护效力。此外使用较低剂量的sarna将最大限度地减少递送材料(如阳离子脂质体)的使用,从而有助于控制成本和潜在的副作用。
2、sarna相对于传统的mrna的长度更长,可达9-12 kb。这是因为除了最基本的mrna元件,例如帽子、5'utr、3'utr、polya尾,sarna还包含一个的源于alphavirus的非结构蛋白(non-structural protein)序列和一个位于目标基因(gene of interest,goi)上游的26s亚基因组启动子(subgenomic promoter,sg-promoter),非结构蛋白(non-structuralprotein)序列编码来自病毒的4种非结构蛋白(nsp1,nsp2,nsp3,nsp4),结构参见图4中的a。病毒结构蛋白的缺失使 sarna 无法产生传染性病毒。在递送至细胞的胞质溶胶中后,释放的 sarna 具有翻译能力,并与宿主细胞核糖体结合以产生 rna 依赖性 rna 聚合酶(rdrp)或病毒基因组复制装置的四个功能组分:nsp1、nsp2、nsp3 和 nsp4。
3、如图1所示,sarna的非结构蛋白在宿主细胞内的翻译是一个多阶段的过程。sarna进入宿主细胞早期,使用细胞的翻译机制表达两种前体多蛋白p123和p1234,绝大多数翻译产物是p123,只有少数是p1234,p1234通过nsp2蛋白酶的活性顺式切割成为p123和nsp4。作为一种早期复制复合体, p123 + nsp4以正链rna为模板复制出负链rna。一旦p123 + nsp4复合物积累,p123反式断裂形成nsp1、p23和nsp4复合物,能够合成负链和正链rna。随着p23的顺式作用裂解(生成nsp2和nsp3),形成由所有非结构蛋白组成的稳定的晚期复制复合体。然后这四种单组分的非结构蛋白被转化为rdrp,它负责正链基因组和亚基因组mrna的合成。负链基因组rna的合成通过亚基因组启动子转录正链亚基因组mrna,然后翻译目的基因。与传统的 mrna 技术相比,sarna 确实具有巨大的潜力,可以显示出更好的 rna 方法。目前关于sarna的研究越来越多,但迄今尚未有利用sarna进行独立的多顺反子同时自放大和表达的尝试。
4、多顺反子常常存在于原核生物中,一个转录本,可以翻译出多个蛋白。而真核生物,则多利用单顺反子策略。在分子克隆中,我们可以模拟原核生物的这一特点,在真核生物之中使用多顺反子元件,将多个开放阅读框(open reading frame,orf)串联起来,同时表达多个基因。目前,真核细胞中广泛采用的是ires(internal ribosome entry site,ires)元件或自剪切多肽2a(self-cleaving 2a peptide,2a)元件。ires元件具有不依赖帽子结构而独立募集核糖体的功能,进而可以启动下游基因的翻译。但是,ires有一个主要的缺点,与上游顺反子相比,下游顺反子的表达水平比较低(通常为上游的10 %-20 %)。为了克服ires元件的一些缺点,科学家们将自剪切多肽2a改造到了多顺反子载体中。这些短肽被认为是通过使核糖体跳过2a元件c端肽键的合成来发挥作用的,由于其独特的“剪切”机制,导致最终分别得到一个融合有2a肽尾巴的上游蛋白和一个n端带有一个脯氨酸的下游蛋白。2a元件的优点是顺反子属于同一编码框架,表达强度趋于一致。但其缺点是会在目标蛋白的n端或c端增加额外的2a肽残留序列,这可能会对目的蛋白的功能造成一定的影响。但由于ires和2a肽两者各自存在的优缺点,在体外实验中人们有时仍需要寻找新方法来进行多顺反子的表达。
技术实现思路
1、本发明提供了一种多顺反子自放大rna,其结构如式(i)所示:
2、(i)
3、其中,sgp-n单元与goi-n单元组成重复框架,n为大于1的整数,且utr单元、nsp1234/sgp-1单元、重复框架内的各sgp-n单元的序列均来源于甲病毒。
4、本发明提供的重复框架,是指sgp单元与goi单元的组合,本发明提供的自放大rna,其中第一个sgp-1单元的5'端部分与nsp1234的3'末端部分重合,即第一个sgp-1单元与nsp1234单元存在部分重叠序列,除了与nsp1234重叠的sgp-1及与之相连的goi-1单元以外,sgp-n单元与goi-n单元则相互独立并以串联的形式存在,因此sgp-n单元与goi-n单元的组合被称为重复框架,但是每个重复框架的内的具体序列可以不相同。在一些实施方式中,自放大rna包含一个重复框架,即重复框架1(含sgp+goi-2),其中goi-1和goi-2分别表达不同的蛋白质。在一些实施方式中,自放大rna包含两个重复框架,分别是重复框架1(含sgp+goi-2)和重复框架2(含sgp+goi-3),其中goi-1、goi-2和goi-3分别表达不同的蛋白质。在一些实施方式中,自放大rna包含三个重复框架,分别是重复框架1(含sgp+goi-2),重复框架2(含sgp+goi-3),和重复框架3(含sgp+goi-4),其中goi-1、goi-2,goi-3和goi-4分别表达不同的蛋白质。sgp-1和sgp-n中的“-1”和“-n”用于标记sgp单元在式(i)中的序号,对goi单元也是如此。
5、本发明提供的多顺反子自放大rna(polycistronic / multicistronic self-amplifying rna, psarna / msarna),其中各单元的序列除nsp1234的3'末端和第1个sgp单元的5'端部分重合外,其他序列均相互独立。
6、甲病毒(alphavirus)是一类由蚊虫等节肢动物传播的、有囊膜、单链、正义rna病毒,属于披膜病毒科(togaviridae),能广泛感染人、鸟、鼠、马等多种动物并引起相关疾病,如委内瑞拉马脑炎病毒(venezuelan equine encephalitis virus,veev)、森林脑炎病毒(semliki forest virus,sfv)和辛德毕斯病毒( sindbis virus, sinv) 等。
7、本发明设计的多顺反子自放大rna(polycistronic / multicistronic self-amplifying rna, psarna / msarna),在保留传统单顺反子sarna自放大效果的同时,能够在一条rna链上进行多顺反子rna的独立自放大和蛋白表达。该方法简单易行,可以定制化无差别的在一个细胞表达多个目的基因。
8、进一步地,n为2-5中的任意一个整数。具体地,n可以是2、3、4、5。
9、进一步地,自放大rna中的甲病毒选自veev、sfv或sinv中的一种或多种。
10、在一些实施方式中,自放大rna的utr单元、nsp1234单元、各sgp单元的序列均来源于同一甲病毒。在一些实施方式中,自放大rna的utr单元、nsp1234/sgp-1单元、各sgp-n单元的序列均来源于veev。在一些实施方式中,自放大rna的utr单元、nsp1234/sgp-1单元、各sgp-n单元的序列均来源于sfv。在一些实施方式中,自放大rna的utr单元、nsp1234/sgp-1单元、各sgp-n单元的序列均来源于sinv。
11、在一些实施方式中,自放大rna的utr单元、nsp1234/sgp-1单元、各sgp-n单元中的至少一个单元的甲病毒来源与其它单元不同。在一些实施方式中,自放大rna的utr单元与nsp1234/sgp-1单元、各sgp-n单元中的甲病毒来源不同。在一些实施方式中,自放大rna的nsp1234/sgp-1单元与utr单元、各sgp-n单元的甲病毒来源不同。在一些实施方式中,自放大rna包含两个重复框架,两个重复框架内的sgp-2和sgp-3分别来自不同的甲病毒。
12、在一些实施方案中,所述5'utr单元的序列如seq id no:1、8或15所示;所述3'utr单元的序列如seq id no:7、14或21所示;所述sgp单元的序列如seq id no:6、13或20所示;所述nsp1234/sgp-1单元的序列为串联连接的nsp1234序列和所述sgp单元的序列,只是去除所述sgp单元的序列5'端与所述nsp1234序列的3'端重叠的部分,其中所述nsp1234序列为串联连接的nsp1蛋白、nsp2蛋白、nsp3蛋白和nsp4蛋白的rna编码序列,其中所述nsp1蛋白的rna编码序列如seq id no:2、9或16所示,所述nsp2蛋白的rna编码序列如seq id no:3、10或17所示,所述nsp3蛋白的rna编码序列如seq id no:4、11或18所示,所述nsp4蛋白的rna编码序列如seq id no:5、12或19所示。
13、本发明还提供一种质粒,该质粒为能够转录如上所述的任意一种自放大rna的质粒。
14、进一步地,质粒还包含t7启动子。在一些实施方式中,t7启动子位于5'utr单元编码序列的前面(即5'方向)。
15、在一些实施方式中,质粒还包含截短的人源rna聚合酶i启动子。在一些实施方式中,截短的人源rna聚合酶i启动子位于t7启动子的前面。
16、在一些实施方式中,设计和构建质粒时,在t7启动子前设计了截短的人源rna聚合酶i启动子,该启动子在直接转染质粒进入真核细胞后可直接转录出自放大rna发挥作用。而t7启动子可用于体外转录人工合成自放大rna,其后是甲病毒来源的5'utr和nsp1234序列,其中第一个亚基因组启动子的5'端部分序列和nsp4序列3'末端部分重叠,在第一个亚基因组启动子后设计了目的基因1 (如绿色荧光蛋白报告基因:neongreen),在neongreen最后一个密码子后再次连接亚基因组启动子和其他目的基因(如红色荧光蛋白报告基因:mtagrfp)的序列框架(可反复),然后连接甲病毒来源的3'utr和polya尾,在polya尾后设计的有单酶切位点,接着是rna聚合酶i终止子(seq id no:28)和t7终止子(seq id no:26)。
17、在一些实施方式中,设计和构建质粒时,在t7启动子前设计了截短的人源rna聚合酶i启动子,该启动子在直接转染质粒进入真核细胞后可直接转录出自放大rna发挥作用。而t7启动子可用于体外转录人工合成自放大rna,其后是veev病毒来源的5'utr和nsp1234序列,其中第一个sgp部分序列和nsp4序列3'末端部分重叠,在第一个sgp序列连接目的基因1 (如蓝色荧光蛋白报告基因:mtagbfp);在mtagbfp最后一个密码子后连接第二个veev病毒来源的亚基因组启动子和其他目的基因(如绿色荧光蛋白报告基因:neongreen),在neongreen最后一个密码子后连接第三个veev病毒来源的亚基因组启动子和其他目的基因(如红色荧光蛋白报告基因:mtagrfp),然后连接veev病毒来源的3'utr和polya尾,在polya尾后设计的有单酶切位点,接着是鼠源rna聚合酶i终止子和t7终止子。
18、本发明还提供一种上述自放大rna的制备方法,包括以下步骤:
19、s1:构建如上所述任意一种质粒;
20、在一些实施方案中,构建多顺反子自放大rna的质粒时,质粒上的非结构蛋白序列来源于veev和sfv。
21、在一些实施方案中,在病毒的非结构蛋白序列之后,设计目的基因goi-1序列然后连接病毒亚基因组启动子和目的基因goi-2序列。
22、在一些实施方案中,在第一个sgp-1序列后,设计目的基因goi-1序列;接着连接第二个sgp-2序列和目的基因goi-2序列;然后连接第三个sgp-3序列和目的基因goi-3序列。
23、s2:复制质粒并进行提取;
24、s3:对提取的质粒进行线性化切割,得到线性化质粒;
25、在一些实施方案中,质粒线性化为采用限制性核酸内切酶酶切的方法将表达多顺反子自放大rna的质粒在polya尾后进行酶切反应。
26、s4:对线性化质粒进行转录,得到自放大rna。
27、在一些实施方案中,采用体外共转录加帽的方法进行多顺反子自放大rna(psarna/ msarna)的制备。
28、本发明设计的多顺反子自放大rna(psarna / msarna),其结构式如式(i)所示,包含多个goi,通过在每个goi前设置的sgp,在保留传统单顺反子sarna自放大效果的同时,能够在一条rna链上进行多顺反子rna的独立自放大和蛋白表达。该方法简单易行,可以定制化无差别的在一个细胞表达多个目的基因。
1.一种多顺反子自放大rna,其结构如式(i)所示:
2.如权利要求1所述的自放大rna,其中,所述n为2-5中的任意一个整数。
3.如权利要求1所述的自放大rna,其中,所述甲病毒选自veev、sfv和sinv。
4.如权利要求1所述的自放大rna,其中,所述utr单元、所述nsp1234/sgp-1单元、所述各sgp单元的序列均来源于同一甲病毒。
5.如权利要求1所述的自放大rna,其中,所述utr单元、所述nsp1234/sgp-1单元、所述各sgp单元中至少一个单元的甲病毒来源与其它单元不同。
6.如权利要求1所述的自放大rna,其中,所述goi-1单元与所述重复框架内的各goi-n单元分别为不同的目的基因。
7.如权利要求1所述的自放大rna,其中,
8.一种质粒,包括权利要求1至权利要求7中任意一项所述的自放大rna的编码序列。
9.如权利要求8所述的质粒,其中,所述质粒在所述自放大rna的编码序列上游还包含t7启动子。
10.如权利要求9所述的质粒,其中,所述质粒在所述自放大rna的编码序列上游还包含截短的人源rna聚合酶i启动子。
11.权利要求1至权利要求7任意一项所述的自放大rna的制备方法,包括以下步骤: