本公开内容通常涉及分子生物学领域,特别涉及用于基因编辑的新型crispr casrna可编程dna核酸内切酶。
背景技术:
1、成簇的规律间隔的短回文重复序列(crispr)和crispr相关(cas)基因,统称为crispr-cas或crispr/cas系统,目前被认为是为细菌和古细菌提供对噬菌体感染的免疫力。原核生物适应性免疫的crispr-cas系统是一组极其多样化的蛋白质效应器非编码元件,及基因座架构,其中一些实例已被工程化和适应以产生重要的生物技术。
2、参与宿主防御的系统的组成部分包括一种或多种能够修饰dna或rna的效应蛋白,以及负责将这些蛋白活性靶向至噬菌体dna或rna上特定序列的rna向导元件。向导rna由crispr rna(crrna)组成,且可需要额外的反式作用rna(tracrrna)以能够通过所述效应蛋白操纵靶核酸。crrna由称为“正向重复序列”的区段(segment)和称为“间隔区序列(spacersequence)”的区段组成,称为“正向重复序列”的区段负责将crrna与效应蛋白结合,称为“间隔区序列”的区段与所需的核酸靶序列互补。crispr系统可以通过修饰crrna的间隔区序列来重新编程以靶向替代的dna或rna靶标。
3、crispr-cas系统可大致分为两类:第1类系统由多个效应蛋白组成,其共同在crrna周围形成复合物,以及第2类系统由单一效应蛋白组成,其与crrna的复合物引导至靶dna或rna底物。第2类系统的单亚基效应器组合物为工程化和应用提供了更简单的组分集,且因此是迄今为止可编程的效应器的重要来源。因此,新的第2类系统的发现、工程化和优化可产生用于基因组工程化和其他领域的广泛应用且强大的可编程技术。使用crispr(成簇的规律间隔的短回文重复序列,clustered regularly interspaced shortpalindromic repeats)-cas(crispr相关蛋白,crispr associated proteins)的rna引导的dna靶向原理编辑基因组,在过去几年中得到了广泛的应用。已经记载了五种类型的crispr-cas系统(i型,ii型和iib型,ill型,v型和vi型)。用于基因组编辑的最多使用的crispr-cas是ii型系统。细菌ii型crispr-cas系统提供的主要优势在于对可编程dna干涉的最低需求:由可定制的双rna结构引导的核酸内切酶cas9。正如在酿脓链球菌(streptococcus pyogenes)的原始ii型系统中所证实的,反式激活crispr rna(tracrrna)与前体crispr rna(pre-crrna)的不可变重复序列结合,以形成双rna,该双rna对于rnaseiii在存在cas9的情况下的crrna共成熟和cas9切割侵入dna都是必不可少的。正如在化脓链球菌中所证明的,cas9在成熟活化的tracrrna和靶向crrna之间形成的双链体的引导下,在入侵的同源dna中引入了位点特异性双链dna(dsdna)断裂。cas9是多结构域酶,其使用hnh核酸酶结构域来切割靶标链(定义为与crrna的间隔区序列互补)和ruvc-样结构域来切割非靶标链。
4、除了ii型crispr cas9核酸酶外,还记载了许多不同的v型crispr cas9核酸酶,例如cas12a、cas12b、cas12e、cas12f、cas13a、cas13b(koonin等人,curr opinmicrobiol.2017年6月;37:67-78,和makarova等人,nat rev microbiol.2020年2月;18(2):67-83.)。这些系统中的一些系统不需要tracr rna(cas 12a,cas 13a,cas 13b),然而cas 12b通常需要tracr rna(kooni等人,curr opin microbiol.2017年6月;37:67-78)。
5、哺乳动物细胞中的基因组编辑至今受到限制,部分原因是各种cas9蛋白的尺寸。来自酿脓葡萄球菌(staphylococcus pyogenes)的cas9(spycas9)是迄今使用最广泛的酶,包含约4.2kb的dna(w02013/176722),与同源单向导rna(sgrna)的直接结合进一步增加了其尺寸。腺相关病毒是基因治疗应用中用于递送cas9酶的载体之一。然而,aav的载货(cargo)尺寸限制在4.5kb左右。由于尺寸限制,递送cas9与其sgrna和潜在的dna修复模板可成为使用该方法的障碍。更小的cas9分子的特点已被表征,但它们中的大多数具有原型间隔相邻基序(pam)序列,该序列不如spycas9所使用的序列那样明确定义。例如,金黄色葡萄球菌(staphylococcus aureus)(saucas9使用“nngrr(t)”序列,其中r=a或g,且空肠弯曲杆菌(campylobacter jejuni)(cja)cas9分别使用“nnnacac”/“nnnryac”pam(其中y=t或g)。所述pam的模糊性增加了酶在与pam具有高度或完全序列一致性的脱靶序列上产生不需要活性的可能性。这些系统的特异性仍然值得关注,因为意外(“脱靶”)靶向类似位点将增加不良事件的可能性。
6、现有的crispr-cas系统通常具有以下一个或多个缺点:
7、a)它们的尺寸太大,以至于无法在已建立的适合治疗的病毒递送系统的基因组中携带,如腺相关病毒(aav)。
8、b)它们中多数在非宿主环境中无明显活性,例如在真核细胞中,且特别是在哺乳动物细胞中。
9、c)当间隔区序列和原型间隔序列之间存在错配时,它们的核酸酶可以催化dna链切割,导致不期望的脱靶效应,例如,使它们不适合基因治疗用途或其他需要高精度的应用。
10、d)它们可引发免疫应答,该应答可限制其在哺乳动物体内的应用。
11、e)它们需要复杂的和/或长的pam,该pam限制dna靶向区段的靶标选择。
12、f)它们在质粒或病毒载体上表现出低表达。
13、g)它们需要额外的rna序列来激活或额外的rna序列作为向导rna的一部分。
技术实现思路
1、本发明涉及一种命名为b-gen的新型v型crispr cas核酸酶,其包含b-gen.1(seqid no:1),b-gen1.2(seq id no:39)和b-gen.2(seq id no:2),或任何蛋白质或编码其的任何核酸,所述蛋白质与seq id no:1、2或39中的任一序列在其整个长度上具有至少80%同一性,优选至少85%,更优选至少90%,甚至更优选至少95%,特别地优选至少99%,最优选至少99.5%的氨基酸同一性。
2、或者,本发明涉及一种命名为b-gen的新型v型crispr cas核酸酶,其包含b-gen.1(seq id no:1)和b-gen.2(seq id no:2),或任何蛋白质或编码其的任何核酸,所述蛋白质或与seq id no:1、2中的任一序列在其整个长度上具有至少80%同一性,优选地至少85%,更优选地至少90%,甚至更优选地至少95%,特别优选地至少99%,最优选地至少99.5%的氨基酸同一性。
3、本发明进一步涉及crispr cas系统,其包含b-gen.1或b-gen.2,合适的向导rna(特别的根据seq id no:40-44),其包含seq id no:3和seq id no:4中包括的序列,和靶dna。
4、在一个替代实施方案中,任何b-gen1.2(seq id no:39)是本文中在任何对于b-gen.1(seq id no:1)的实施方案中的合适且功能相同的替代物。
5、在一个方面,本文提供了一种在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的方法,该方法包括(i)将本文公开的异源b-gen.1或b-gen.2多肽或编码本文公开的b-gen.1或b-gen.2的核酸引入至细胞或引入至体外环境中;和(ii)将一个或多个异源单向导rna(sgrna)或编码这样的一个或多个sgrna的dna引入至细胞或体外环境中,每个sgrna或编码该sgrna的dna包含:(a)工程化的dna靶向区段,其包含rna且能够与多核苷酸基因座上的靶序列杂交,(b)由rna组成的tracr伴侣序列(tracr mate sequence),以及(c)由rna组成的tracr rna序列,其中所述tracr伴侣序列与所述tracr序列杂交,且其中(a)、(b)和(c)以5’至3’方向排列;和(iii)在靶dna中产生一个或多个切口(nick)或缺口(cut)或碱基编辑,其中b-gen.1或b-gen.2多肽以其加工或未加工形式通过所述sgrna被引导至靶dna。
6、在一个方面,本文提供了一种组合物用于在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的用途,所述组合物包含:(i)本文公开的b-gen.1或b-gen.2多肽或编码其的核酸;和/或(ii)一个或多个单异源向导rna(sgrna)或适合于原位产生这样的一个或多个sgrna的dna,每种包含:(a)工程化的dna靶向区段,其由rna组成且能够与多核苷酸基因座上这样的靶序列杂交;(b)由rna组成的tracr伴侣序列;和(c)由rna组成的tracrrna序列,其中所述tracr伴侣序列与所述tracr序列杂交,且其中(c)、(b)和(a)分别以5’至3’方向排列。
7、在另一个方面,本文提供了一种细胞,其包含:(i)如本文公开的b-gen.1或b-gen.2多肽,或编码本文公开的b-gen.1或b-gen.2多肽的核酸;和(ii)一个或多个单异源向导rna(sgrna)或适合于原位产生这样的一个或多个sgrna的dna,每种包含:(a)工程化的dna靶向区段,其可以与多核苷酸基因座上的靶序列杂交,(b)tracr伴侣序列,和(c)tracrrna序列,其中所述tracr伴侣序列可以与所述tracr序列杂交,且其中(c)、(b)和(a)分别以5’至3’方向排列。
8、在另一个方面,本文提供了一种试剂盒,其包含:(i)编码如本文所公开的b-gen.1或b-gen.2多肽的核酸序列,其中编码b-gen.1或b-gen.2的核酸序列可操作地连接至启动子;和(ii)一个或多个单异源向导rna(sgrna)或适合于原位产生这样的一个或多个sgrna的dna,每个sgrna包含:(a)工程化的dna靶向区段,其可以与多核苷酸基因座上的靶序列杂交,(b)tracr伴侣序列,和(c)tracr rna序列,其中所述tracr伴侣序列可以与所述tracr序列杂交,且其中(a)、(b)和(c)以5’至3’方向排列。
9、在另一个方面,本文还公开了5个合成衍生和优化的sgrna(seq id nos:40-44)序列。这些序列需要在其3’端有大约20个核苷酸的序列特异性段(stretch),其提供所述序列特异性引导。
10、为了在低活性靶标上,提高b-gen.1(seq id no:1)的活性,和其他还可能的v型crispr cas核酸酶的活性,且为了减少用于未来治疗方案的rna合成负担,设计了缩短和突变的sgrna。seq id nos:40-44的sgrna表现出更高的活性,特别是在难以编辑的靶标上,且具有显著降低的长度(用20个核苷酸向导序列表示):
11、1.seq id no:40:b-gen.1_sgrna4,117个核苷酸
12、2.seq id no:41:b-gen.1_sgrna4.2,107个核苷酸
13、3.seq id no:42:b-gen.1_sgrna4.3,107个核苷酸
14、4.seq id no:43:b-gen.1_sgrna4.4,107个核苷酸
15、5.seq id no:44:b-gen.1_sgrna4.5,106个核苷酸
16、在另一方面,本发明涉及以下的组合:
17、a)b-gen.1(seq id no:1)或b-gen.1.2(seq id no:39),或任何蛋白质或编码其的任何核酸,所述蛋白质与seq id no:1、2中的任一序列在其整个长度上具有至少80%同一性,优选地至少85%,更优选地至少90%,甚至更优选地至少95%,特别优选地至少99%,最优选地至少99.5%的氨基酸同一性,和
18、b)包含选自seq id nos:40、41、42、43和45的序列的sgrna。
19、通常,这些sgrna序列在它们的3’端包含靶标特异性序列,其通常具有大约20个核苷酸的长度。
20、所述sgrna也可以用于其他v型crsipr cas核酸酶。
21、本文引用的每一项专利文件和科学文献的全部公开内容,以及在其中引用的那些专利文件和科学文献,均通过引用明确并入本文,用于所有目的。
22、下面更具体地描述本发明的额外的特征和优点。
1.一种多肽,其选自:seq id no:1或seq id no:39的b-gen.1,和seq id no:2的b-gen.2,与上述任何一种具有至少80%同一性的任何多肽序列,或编码其的任何核酸。
2.一种组合物,其包含根权利要求1所述的多肽和sgrna,所述sgrna包含选自seq idnos:40、41、42、43和45的序列。
3.一种组合物,其包含:
4.根据权利要求2或3所述的组合物,其中所述工程化的dna靶向片段在其3’端直接邻近靶dna区段上的pam序列,或者这样的pam序列是靶dna序列在其5’部分的一部分,其中pam序列包含序列基序“dttn”,其中“d”代表“a”或“t”或“g”且“n”代表任意核苷酸。
5.在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的方法,所述方法包括:
6.一种组合物用于在细胞或体外的一个或多个位置靶向、编辑、修饰或操纵靶dna的用途,所述组合物包含:
7.一种细胞,其包含:
8.一种试剂盒,其包含:
9.一种核酸或任何核酸,其包含选自seq id no:40-44的核酸。
