发明领域本发明尤其涉及用于基因组编辑的组合物和方法。
背景技术:
0、发明背景
1、细菌和古细菌适应性免疫的成簇规律间隔短回文重复序列(clusteredregularly interspaced short palindromic repeat,crispr)系统显示出蛋白质组成和基因组基因座位结构(genomic loci architecture)的极端多样性。crispr系统已经成为研究和基因组工程的重要工具。然而,crispr系统的许多细节尚未确定,并且crispr核酸酶的适用性可能受到序列特异性要求、表达或递送挑战的限制。不同的crispr核酸酶具有不同的特征,例如:大小、pam位点、中靶活性、特异性、切割模式(例如,平末端、交错末端)和切割后形成的突出的indel(insertion-deletion,插入-缺失)模式。不同的特征集合可用于不同的应用。例如,一些crispr核酸酶可能能够靶向其他crispr核酸酶由于pam位点的限制而无法靶向的特定基因组基因座。此外,目前使用的一些crispr核酸酶表现出预免疫性,这可能会限制体内适用性。参见charlesworth等人,nature medicine(2019)和wagner等人,nature medicine(2019)。因此,新型crispr核酸酶的发现、工程化和改进是重要的。
技术实现思路
1、本文公开了可用于基因组工程、表观基因组工程、基因组靶向、细胞的基因组编辑和/或体外诊断的组合物和方法。
2、所公开的组合物可用于修饰基因组dna序列。如本文所用,基因组dna是指存在于一个或多个目的细胞中的线性和/或染色体dna和/或质粒或其他染色体外dna序列。在一些实施方案中,目的细胞是真核细胞。在一些实施方案中,目的细胞是原核细胞。在一些实施方案中,所述方法在基因组dna序列中的预定靶位点处产生双链断裂(dsb),导致基因组中靶位点处的dna序列的突变、插入和/或缺失。
3、因此,在一些实施方案中,组合物包含成簇规律间隔短回文重复序列(crispr)核酸酶。在一些实施方案中,crispr核酸酶是crispr相关蛋白。
4、omni crispr核酸酶
5、本发明的实施方案提供了如表1中提供的被称为“omni”核酸酶的crispr核酸酶。
6、本发明提供了一种修饰哺乳动物细胞基因组中靶位点处的核苷酸序列的方法,该方法包括向细胞中引入(i)一种组合物,该组合物包含与选自seq id no:1-17的氨基酸序列具有至少95%的同一性的crispr核酸酶,或包含编码crispr核酸酶的序列的核酸分子,该序列与选自seq id no:18-51的核酸序列具有至少95%的同一性;和(ii)dna靶向的rna分子或编码该dna靶向的rna分子的dna多核苷酸,其包含与靶dna中的序列互补的核苷酸序列。
7、本发明还提供了包含crispr相关系统的非天然存在的组合物,该crispr相关系统包含:
8、a)一种或多种rna分子,其包含与同向重复序列连接的向导序列部分,其中所述向导序列能够与靶序列或编码所述一种或多种rna分子的一种或多种核苷酸序列杂交;以及
9、b)一种crispr核酸酶,其包含与选自seq id no:1-17的氨基酸序列具有至少95%同一性的氨基酸序列,或包含编码crispr核酸酶的序列的核酸分子;以及
10、其中所述一种或多种rna分子与所述靶序列杂交,其中所述靶序列与前间隔序列邻近基序(protospacer adjacent motif,pam)的互补序列的3'端相邻,并且所述一种或多种rna分子与所述rna引导的核酸酶形成复合物。
11、本发明还提供了非天然存在的组合物,其包含:
12、a)一种crispr核酸酶,其包含与选自seq id no:1-17的氨基酸序列具有至少95%同一性的序列,或包含编码crispr核酸酶的序列的核酸分子;以及
13、b)一种或多种rna分子,或编码所述一种或多种rna分子的一种或多种dna多核苷酸,其包含以下中的至少一种:
14、i)能够与crispr核酸酶相互作用/结合的结合核酸酶的rna核苷酸序列;以及
15、ii)dna靶向的rna核苷酸序列,其包含与靶dna序列中的序列互补的序列,
16、其中所述crispr核酸酶能够与所述一种或多种rna分子复合以形成能够与靶dna序列杂交的复合物。
1.一种包含crispr核酸酶的非天然存在的组合物,所述crispr核酸酶包含与选自seqid no:3、1或2-17的氨基酸序列具有至少90%同一性的序列,或包含编码crispr核酸酶的序列的核酸分子。
2.如权利要求1所述的组合物,其还包含一种或多种rna分子,或编码所述一种或多种rna分子中的任一种的dna多核苷酸,其中所述一种或多种rna分子和所述crispr核酸酶天然不在一起,并且所述一种或多种rna分子被配置成与所述crispr核酸酶形成复合物和/或将所述复合物靶向靶位点。
3.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:3中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:82-97的序列。
4.如权利要求3所述的组合物,其中所述crispr核酸酶包含与seq id no:3中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:82-85和96的序列的crispr rna(crrna)分子。
5.如权利要求4所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:86-93和97所示的序列。
6.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:3中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:82-97的序列的单向导rna(sgrna)分子。
7.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:52-64的序列。
8.如权利要求7所述的组合物,其中所述crispr核酸酶包含与seq id no:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:52-55的序列的crispr rna(crrna)分子。
9.如权利要求8所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:56-63所示的序列。
10.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:52-64的序列的单向导rna(sgrna)分子。
11.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:2中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:65-81的序列。
12.如权利要求11所述的组合物,其中所述crispr核酸酶包含与seq id no:2中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:65-68和80的序列的crispr rna(crrna)分子。
13.如权利要求12所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:69-77和81所示的序列。
14.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:2中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:65-81的序列的单向导rna(sgrna)分子。
15.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:4-9中任一项所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq idno:98-114的序列。
16.如权利要求15所述的组合物,其中所述crispr核酸酶包含与seq id no:4-9中任一项所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:98-101和114的序列的crispr rna(crrna)分子。
17.如权利要求16所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:102-111所示的序列。
18.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:4-9中任一项所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:98-114的序列的单向导rna(sgrna)分子。
19.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:10中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:115-127的序列。
20.如权利要求19所述的组合物,其中所述crispr核酸酶包含与seq id no:10中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:115-118的序列的crispr rna(crrna)分子。
21.如权利要求20所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:119-126所示的序列。
22.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:10中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:115-127的序列的单向导rna(sgrna)分子。
23.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:11中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:128-141的序列。
24.如权利要求23所述的组合物,其中所述crispr核酸酶包含与seq id no:11中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:128-131的序列的crispr rna(crrna)分子。
25.如权利要求24所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:132-140所示的序列。
26.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:11中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:128-141的序列的单向导rna(sgrna)分子。
27.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:12中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:142-155的序列。
28.如权利要求27所述的组合物,其中所述crispr核酸酶包含与seq id no:12中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:142-145的序列的crispr rna(crrna)分子。
29.如权利要求28所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:146-152和155所示的序列。
30.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:12中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:142-155的序列的单向导rna(sgrna)分子。
31.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:13中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:156-167和gcuuuaagc的序列。
32.如权利要求31所述的组合物,其中所述crispr核酸酶包含与seq id no:13中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:156-159的序列的crispr rna(crrna)分子。
33.如权利要求32所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:160-166和gcuuuaagc所示的序列。
34.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:13中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:156-167和gcuuuaagc的序列的单向导rna(sgrna)分子。
35.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:14或15中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:168-176的序列。
36.如权利要求35所述的组合物,其中所述crispr核酸酶包含与seq id no:14或15中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:168和169的序列的crispr rna(crrna)分子。
37.如权利要求36所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:170-175所示的序列。
38.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:14或15中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:168-176的序列的单向导rna(sgrna)分子。
39.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:16中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:177-185的序列。
40.如权利要求39所述的组合物,其中所述crispr核酸酶包含与seq id no:16中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:177和178的序列的crispr rna(crrna)分子。
41.如权利要求40所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:179-184所示的序列。
42.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:16中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:177-185的序列的单向导rna(sgrna)分子。
43.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:17中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子包含选自seq id no:186-202的序列。
44.如权利要求43所述的组合物,其中所述crispr核酸酶包含与seq id no:17中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:186-189和201的序列的crispr rna(crrna)分子。
45.如权利要求44所述的组合物,其还包含反式激活crispr rna(tracrrna)分子,所述反式激活crispr rna分子包含seq id no:190-198和202所示的序列。
46.如权利要求2所述的组合物,其中所述crispr核酸酶包含与seq id no:17中所示的氨基酸序列具有至少90%同一性的序列,并且至少一种rna分子是包含向导序列部分和选自seq id no:186-202的序列的单向导rna(sgrna)分子。
47.如权利要求1-46中任一项所述的组合物,其中所述crispr核酸酶是具有失活的ruvc结构域的切口酶,所述失活的ruvc结构域通过在表1第5列中为所述crispr核酸酶提供的位置处的氨基酸取代而产生。
48.如权利要求1-46中任一项所述的组合物,其中所述crispr核酸酶是具有失活的hnh结构域的切口酶,所述失活的hnh结构域通过在表1第6列中为所述crispr核酸酶提供的位置处的氨基酸取代而产生。
49.如权利要求1-46中任一项所述的组合物,其中所述crispr核酸酶是具有失活的ruvc结构域和失活的hnh结构域的无催化活性的核酸酶,所述失活的ruvc结构域和失活的hnh结构域通过在表1第7列中为所述crispr核酸酶提供的位置处的取代而产生。
50.如权利要求1-49中任一项所述的组合物,其中所述crispr核酸酶利用了在表3第2-4列中为所述crispr核酸酶提供的前间隔序列邻近基序(pam)序列。
51.一种修饰无细胞系统或细胞基因组中dna靶位点处的核苷酸序列的方法,其包含向细胞中引入权利要求2-50中任一项所述的组合物。
52.如权利要求51所述的方法,其中所述crispr核酸酶在与表3第2-4列中为所述crispr核酸酶提供的前间隔序列邻近基序(pam)序列相邻的dna链中实现dna断裂,和/或在与所述pam序列互补的序列相邻的dna链中实现dna断裂。
53.如权利要求51所述的方法,其中所述crispr核酸酶是具有失活的ruvc结构域的切口酶并且在与所述pam序列互补的序列相邻的dna链中实现dna断裂,所述失活的ruvc结构域通过在表1第5列中为所述crispr核酸酶提供的位置处的氨基酸取代而产生。
54.如权利要求51所述的方法,其中所述crispr核酸酶是具有失活的hnh结构域的切口酶并且在与pam序列相邻的dna链中实现dna断裂,所述失活的hnh结构域通过在表1第6列中为所述crispr核酸酶提供的位置处的氨基酸取代产生。
55.如权利要求51-54中任一项所述的方法,其中所述细胞是真核细胞或原核细胞。
56.如权利要求55所述的方法,其中所述细胞是哺乳动物细胞。
57.如权利要求56所述的方法,其中所述细胞是人细胞。