1、基因组编辑基因组编辑应用基因编辑技术不长角的奶牛基因编辑的定义:基因编辑的定义:通过精确识别靶细胞通过精确识别靶细胞DNA片段中靶点的核苷酸序列,利用核片段中靶点的核苷酸序列,利用核酸内切酶对酸内切酶对DNA靶点序列进行切割,从而完成对靶细胞靶点序列进行切割,从而完成对靶细胞DNA目的基因片段的精确编辑。目的基因片段的精确编辑。基因编辑的优势基因编辑的优势与传统的以同源重组和胚胎干细胞(embryonic stem cell,ES)技术为基础的基因打靶技术相比,基因编辑新技术保留了可定点修饰的特点,可应用到更多的物种上,效率更高,构建时间更短,成本更低。基因编辑原理基因编辑原理现代基因组编辑技
2、术的基本原理是相同的,即借助特异性 DNA 双链断裂(DNA double-strand breaks DSBs)激活细胞天然的修复机制,包括非同源末端连接(NHEJ)和同源重组修复(HDR)两条途径。第一代:ZFN(锌指核酸酶)第二代:TALEN(转录激活样效应因子核酸酶)第三代:CRISPR/Cas9(成簇的规律性间隔的短回文重复序列)第四代:NgAgo-gDNA 韩春雨基因编辑发展史基因编辑发展史 ZFN ZFN 基因组编辑技术基因组编辑技术 ZFN 技术是第一代基因组编辑技术,其功能的实现是基于具有独特的DNA序列识别的锌指蛋白发展起来的。1986年Diakun 等首先在真核生物转录因
3、子家族的 DNA 结合区域发现了Cys2-His2锌指模块。1996年,Kim等首次人工连接了锌指蛋白与核酸内切酶。2005年,Urnov等发现一对由4个锌指连接而成的ZFN可识别24 bp的特异性序列,由此揭开了ZFN在基因组编辑中的应用。ZFN 诱导的基因组编辑技术可应用于很多物种及基 因位点,具有较好的发展潜力。缺点:(1)以现有的策略设计高亲和性的 ZFN,需要投入大量的工作和时间;(2)在细胞中持续表达 ZFN 对细胞有毒性;(3)虽然三联体设计具有一定特异性,但仍然存在不同程度的脱靶效应。TALEN TALEN 基因组编辑技术基因组编辑技术 2009 年,研究者在植物病原体黄单胞菌
4、Xanthomonas)中发现一种转录激活样效应因子(TAL蛋白),它的核酸结合域的氨基酸序列与其靶位点的核酸序列有恒定的对应关系,一个模块单元识别一个碱基,简单且特异性极好。随后,TALE特异识别 DNA 序列的特性被用来取代 ZFN技术中的锌指蛋白。它可设计性更强,不受上下游序列影响,具备比ZFN 更广阔的应用潜力。TALENs 包含两个 TALEN 蛋白,每个 TALEN 都是由 TALE array 与 Fok融合而成.其中一个 TALEN 靶向正义链上靶标位点,另一个则靶向反义链上的靶标位点.然后 Fok形成二聚体,在靶向序列中间的 spacer 处切割 DNA,造成双链 DNA
5、断裂,随后细胞启动 DNA 损伤修复机制.针对不同的TALEN 骨架,其最适宜的spacer长度不同,其长度范围一般为1220 bp.实验结果表明,TALENs在靶向DNA时,第一个碱基为 T 时其结合效果更佳。通过组合各类模块,可对任意核苷酸序列进行靶向特异性敲除或内源基因的表达调控。目前已在人、大鼠、小鼠、猪、羊、斑马鱼、拟南芥及酵母等多类物种中得到成功应用。CRISPR/Cas9 CRISPR/Cas9 基因组编辑技基因组编辑技术术 CRISPR/Cas9系统的发现可以追溯到1987年,日本学者首次在大肠杆菌(E.coli)基因组中发现一连串短的空间间隔重复序列。随后,在其他细菌和古细菌
6、中也发现了这一特殊的序列。2002年科学家才将其命名为成簇的规律间隔短回文重复序列(Clustered regularly interspaced short palindromic repeats,CRISPR),现有测序结果显示40%的细菌基因组中含有CRISPR位点。2005年,科学家们发现CRISPR中的许多间隔序列来源于质粒和病毒,CRISPR的基因座能够被转录,并且Cas基因编码的蛋白具有核酸酶和解旋酶结构域,因此推测CRISPR/Cas 是利用无义的RNAs标记外源核酸序列的防御系统。2011年,才揭示了CRISPR/Cas系统的分子机制:当病毒首次入侵时,细菌会将外源基因的一段
7、序列整合到自身的CRISPR的间隔区;病毒二次入侵时,CRISPR转录生成crRNA前体(pre-crRNA),pre-crRNA经过加工形成含有与外源基因匹配序列的 crRNA,该crRNA与病毒基因组的同源序列识别后,介导Cas蛋白结合并切割,从而保护自身免受入侵。2013年,研究者报道了CRISPR/Cas9系统可高效地编辑基因组。其中分别在人类细胞和小鼠细胞中成功对部分基因实现了编辑。CRISPR/CasCRISPR/Cas系统概述系统概述 CRISPR/Cas系统广泛存在于细菌和古菌中,是它们的一种适应性免疫系统,能够识别自身和外源入侵DNA片段。CRISPR/Cas系统有3种类型:
8、型、型和型。型和型CRISPR/Cas系统较为复杂,需要多个Cas蛋白形成复合体切割DNA双链,而型CRISPR/Cas系统只需要一个Cas9蛋白核酸酶来切割DNA双链,即为现在广泛应用于遗传学基因编辑的CRISPR/Cas9系统。Type系统中只有一种核酸酶Cas9核酸酶,在该系统中Cas9蛋白与crRNA参与对抗外源噬菌体和质粒的入侵。目前,Type系统在基因组编辑中应用的最为广泛。CRISPR-Cas主要由两部分组成:CRISPR/Cas的结构CRISPR CRISPR 是一个特殊的是一个特殊的DNADNA重复序列家族重复序列家族,广泛分布于细菌和古细菌基广泛分布于细菌和古细菌基因组中。
9、因组中。CRISPR CRISPR 位点通常由短的高度保守的重复序列位点通常由短的高度保守的重复序列(repeats)(repeats)组成组成,重复序列的长度通常重复序列的长度通常 2148 bp,2148 bp,重复序列之间被重复序列之间被 2672 bp 2672 bp 间隔序列间隔序列(spacer)(spacer)隔开。隔开。CRISPRCRISPR就是通过这些间隔序列(就是通过这些间隔序列(spacespace)与靶基因进行)与靶基因进行识别。识别。识别识别切割切割Cas(CRISPR associated):存在于CRISPR位点附近,是一种双链DNA核酸酶,能在guide RN
10、A引导下对靶位点进行切割。它与folk酶功能类似,但是它并不需要形成二聚体才能发挥作用。CRISPR/Cas9系统由间隔重复由间隔重复CRISPRCRISPR基因座转录出来的基因座转录出来的pre-crRNApre-crRNA、多功能的、多功能的Cas9Cas9核酸酶和核酸酶和tracrRNAtracrRNA组成,其中组成,其中tracrRNAtracrRNA促进促进pre-crRNApre-crRNA的成熟,以及形成具有切割活性的成熟,以及形成具有切割活性的的crRNA-tracrRNA-Cas9crRNA-tracrRNA-Cas9三元复合体三元复合体。病毒或质粒入侵细菌后,其基因组DNA
11、暴露于细菌胞浆之中,经过同源重组,CRISPR重复序列转录、翻译出的Cas复合物对外来DNA进行剪切,产生新的spacer序列。如果产生的新spacer序列能够与CRISPR array内部的短重复序列部分互补,将会通过某种未知的方式整合到细菌基因组的CRISPR array 序列中,从而对该病毒或质粒产生特异性免疫记忆。CRISPR/Cas9系统的工作原理和系统的工作原理和机制机制CRISPR/CasCRISPR/Cas9 9系统的工作原理和系统的工作原理和机制机制 当同类的病毒或者质粒再次入侵该细菌时 首先,tracrRNA与pre-crRNA的重复序列结合;第二,内源RNase 切割pr
12、e-crRNA/tracrRNAs复合体,切除5末端的间隔序列,形成成熟的crRNA,并与tracrRNA形成被称为向导RNA(Single guide RNA,sgRNA)的嵌合RNA分子;第三,每一个成熟的sgRNA能够引导Cas9蛋白定位到双链DNA的靶位点上并在原型间隔毗邻序列(Proto-spacer adjacent motif,PAM)的上游38 bp位置对结合的序列进行切割(图2A)。Cas9Cas9的特异性靶点的特异性靶点 依赖于原型间隔序列3端PAM序列,不同的Cas9突变体在基因组中拥有不同的PAM序列,来源于酿脓链球菌(Streptococcus pyogenes)的C
13、as9识别一个5-NGG-3的PAM,而来源于嗜热链球菌(Streptococcus thermophilus)和脑膜炎奈瑟氏菌(Neisseria meningi-tidis)的Cas9分别识别5-NNAGAAW-3的PAM和5-NNNNGATT-3的PAM。Cas9Cas9拥有两个核酸酶结构域拥有两个核酸酶结构域 分别是蛋白中间的HNH结构域和蛋白氨基酸末端附近的RuvC-like结构域,其中HNH切割与crRNA互补的链,切割位点位于PAM序列上游3 bp,RuvC-like切割非互补链,切割位点位于PAM序列上游38 bp,从而造成双链的断裂。Cas9Cas9的特异性靶点和两个核酸酶结
14、构域的特异性靶点和两个核酸酶结构域 CRISPR/Cas9产生的DSB能够激活细胞和生物体自身修复机制,产生两种不同的修复途径NHEJ和HDR修复。NHEJ能够高效地引入不同长度的插入或者缺失突变,导致转录阅读框编码序列,转录激活相关的启动子和增强子的损坏;而HDR的修复通常会引入特定位点的突变或者在外源供体DNA模板存在时对靶位点进行可预测的插入。1.PAM序列区是CRISPR/Cas9系统行使切割功能的基本条件。如果靶序列3端没有PAM序列,即使靶序列与sgRNA序列完全匹配,Cas9蛋白也不会切割该序列位点.2.sgRNA与目标基因组相结合的20nt序列区决定着CRISPR/Cas系统的
15、靶向特异性。CRISPR/Cas9CRISPR/Cas9系统的关键点3.sgRNA的长度也与特异性密切相关。sgRNA的5端额外增加两个鸟嘌呤核苷酸后能够显著提高CRISPR/Cas9系统的特异性。CRISPR/Cas9基因编辑系统的特异性决定于sgRNA上的识别(20nt)。然而,在复杂的生物基因组中,sgRNA的识别序列可能会与非靶点DNA发生局部匹配(Partial match)。这种局部匹配,目前可归结为两类:(1)sgRNA与脱靶位点DNA序列长度相同,但存在碱基错配。(2)脱靶位点DNA序列长度比sgRNA多或少几个碱基,通过形成DNA凸起(DNA bulge)或RNA凸起(RNA
16、 bulge)来完成其他碱基的正确配对。CRISPR/Cas9系统的脱靶效应CRISPR/Cas9CRISPR/Cas9系统在基因组系统在基因组DNADNA片段编辑中的应用片段编辑中的应用1.DNA片段靶向删除2.DNA片段靶向反转3.DNA片段靶向重复4.DNA片段靶向插入5.染色体靶向易位类别类别ZFNTALENCRISPR/Cas9NgAgo-gDNA构成ZF ArrayFok1TALEN ArrayFok1Cas9sgRNANgAgo-gDNA靶向元件ZF Array蛋白 TALENArray蛋白sgRNA核糖核苷酸gDNA脱氧核糖核苷酸切割元件Fok 蛋白Fok 蛋白Cas9蛋白Ag
17、o蛋白优势单位点编辑单位点编辑多位点编辑多位点编辑靶向序列 18bp30bp23bp20bp切割类型双链断裂,单列缺刻双链断裂,单列缺刻双链断裂,单列缺刻双链断裂,单列缺刻技术难度困难较容易非常容易非常容易商业价格60000每位点10000每位点1000每位点?脱靶效应较轻较轻较严重较轻?编辑技术对比NgAgo-gDNANgAgo-gDNA编辑编辑NgAgo-gDNA是格式嗜盐杆菌(Natronobactricum grogoryi)ACO蛋白(Argonauto)的简称,其本质是一种核酸内切酶,NgAgo根据指导DNA的定位,可以有效地对基因组目标区域进行编辑。NgAgo-gDNA 概述概述
18、NgAgo是格氏嗜盐碱杆菌(Natronobacteriumgregoryi)AGO蛋白(Argonaute)的简称,其本质是一种核酸内切酶。NgAgo酶根据指导DNA的定位,可以有效地对基因组目标区域进行编辑。NgAgo-gDNA NgAgo-gDNA 与与 Crispr-C Crispr-Cas9 as9 特点比较特点比较 NgAgo-gDNA Crispr-CAS95-P-ssDNA 介导sgRNA 介导 ssDNA无特殊二级结构要求,除靶序列一致的碱基无需其它碱基参与sgRNA由tracrRNA和crRNA组成,需求固定的二级结构结合靶序列23-25bp结合靶序列19-21bp无需PA
19、M区需要PAM区NgAgo蛋白 由887个氨基酸组成CAS9蛋白 由1368个氨基酸组成可在哺乳动物细胞水平进行基因组编辑可在哺乳动物细胞水平进行基因组编辑NgAgo-gDNA NgAgo-gDNA 的优势的优势1.设计更加灵活 由于NgAgo-gDNA系统无PAM要求,5p ssDNA设计相较sgRNA更加灵活2.理论上精确性会比Crispr-CAS9 高 NgAgo-gDNA识别靶序列的长度会比Crispr-Cas9长约4个碱基,另外DNA-DNA duplex的特异性比RNA-DNA duplex高,所以理论上精确性会更加高。3.对向导序列-靶序列错配容忍度低4.脱靶率低5.5.针对富含
20、GC的靶序列,NgAgo系统比Cas9系统切割效率更高基因功能研究基因治疗构建模式动物改造和培育新品种基因编辑新技术的用途基因编辑新技术的用途1.基因功能研究基因敲除是在活体动物上验证基因功能必不可少的逻辑环节,但是传统的基因敲除方法需要通过复杂的打靶载体构建、ES 细胞筛选、嵌合体动物模型选育等一系列步骤,成功率受到多方面因素的限制。基因编辑新技术则不然,敲除基因高效快速,是研究基因功能的有力工具ZFN 技术已在大鼠、小鼠、斑马鱼、果蝇、拟南芥、玉米、烟草 等模式生物或经济物种的细胞或胚胎中以及包括诱导多能干细胞(induced pluripotent stem cells,iPSC)在内的
21、人体外培养细胞系中成功地实现了内源基因的定点突变,其中在果蝇、斑马鱼、大鼠等物种中还获得了可以稳定遗传的突变体。2.基因治疗传统的基因治疗是将正常的基因片段引入细胞中替代有缺陷的基因,但这种方法难以精准控制,可能产生很大的毒副作用。基因编辑新技术可以精确定位,在靶位点进行修正或进行基因切除,达到基因治疗的目的。Bacman 等人利用 TALEN 技术清除了来自于病人线粒体内的有病 DNA。这是 TALEN 首次应用于线粒体基因的编辑,这项研究有望用于治疗母系遗传的线粒体病。Li 等人利用 ZFN 技术能在染色体上精确定位的优势,通过“剪切”和“粘贴”基因,在实验小鼠体内实现了血友病治疗,避免了
22、传统基因疗法带来的插入诱变风险,首次取得了基因组编辑在基因疗法上的突破。3.构建模式动物基因编辑新技术不受 ES 细胞的限制,效率高,速度快,且定点编辑更加精确,可在多种细胞及生物体的特定位点进行切割和修饰。构建转基因小鼠第一人 Jaenisch 与其同事最近利用 CRISPR-Cas 系统又构建了携带特异性突变的小鼠模型。4.改造和培育新品种 传统的改造动植物品种的转基因技术是将外源 DNA 片段插入受体的基因组中,改造基因功能,使其表达优良的性状,获得人类需要的品种。基因编辑技术则可以进行定点修饰,达到高效定向。Shukla 等对玉米进行肌醇磷酸激酶 1(inositol phosphat
23、e kinase 1,IPK1)基因的修饰,使其对除草剂的耐性增强,在发育的种子中肌醇磷酸盐表达谱也发生了与预期一样的改变。ownsend等以烟草中的丙酮醇合酶(acetolactate synthase)基因 SuR(SuRA和SuRB)位点为靶标,育成了对咪唑啉酮(imidazolinone)除草剂和对磺脲(sulphonylurea)除草剂都有抵抗力的新品种。基因编辑技术的展望随着越来越多物种基因组测序的完成,基因功能的研究成为后基因时代的重点。基因编辑技术既可以用正常基因替代突变基因进行性状改良和基因治疗,也可以用突变基因代替正常基因进行基因功能的研究。基因组编辑技术对应的友好位点的选择,多基因连接策略,表达调控策略等配套的技术体系正在形成,为今后大规模,多基因的动物改良奠定了基础。更多基因组编辑畜禽的出现会给畜牧业经济,人类营养水平和生活质量带来革命性地影响。可以预见,以基因组编辑技术为核心的现代生物技术产业将进入黄金时期。谢谢谢谢