CRISPR Cas9基因编辑是目前流行的基因编辑技术。但是如何把CRISPR Cas9基因编辑方法讲清楚,却不是那么容易的事情。北京理工大学生命学院黄潮勇博士对CRISPR Cas9基因编辑技术进行了深入的研究。今天美格君邀请了黄潮勇博士,就CRISPR Cas9基因编辑技术为大家做一个全面、详细的介绍。大家也可以关注黄潮勇博士的个人微信公众号:[ My BioWorld ],阅读其他相关文章、与黄潮勇博士交流。
CRISPR/Cas系统是原核生物的一种天然免疫系统,存在于大多数细菌和古生菌中。原核生物在遭到病毒入侵后,能够把病毒DNA的一小段提取出来并存储到自身基因组上的特定区域, 我们把这个区域称为CRISPR存储空间。当再次遇到病毒入侵时,原核生物能够根据存储的DNA片段识别病毒,将病毒的DNA切断而使之失效。根据CRISPR/Cas系统的特性,科学家将其改造成了目前最高效的基因组编辑工具。
目前应用最广泛的CRISPR/Cas系统是来源于酿脓链球菌 (Streptococcus pyogenes) 的CRISPR Cas9系统。2012年,Jennifer Doudna和Emmanuelle Charpentier证明CRISPR Cas9系统可以在体外切割双链DNA [1];2013年,张锋首次用CRISPR/Cas9系统在原核生物 (大肠杆菌) 中实现基因组编辑 [2]。
天然的CRISPR-Cas9系统由三部分组成:SpCas9 (以下简称Cas9)、crRNA、tracrRNA。其中,crRNA和tracrRNA通过局部碱基配对组成gRNA(guide RNA),gRNA与Cas9蛋白结合后引导Cas9蛋白识别和切割目标DNA序列 (图1)。为了方便实验设计以及提高gRNA的稳定性,Jennifer Doudna和Emmanuelle Charpentier将crRNA和tracrRNA融合成一条RNA [1],并把其称为sgRNA (single-guide RNA) (图2)。
【图1】天然的CRISPR Cas9系统
【图2】改造后的CRISPR Cas9系统
改造后的CRISPR/Cas9系统成为研究者做基因编辑的首选工具。CRISPR Cas9蛋白要成功识别目标序列必须满足两个条件:(1) sgRNA的5'端20 nt和靶DNA之间碱基配对;(2) 靶DNA的3'端有合适的PAM序列。CRISPR/Cas9切割目标DNA后产生DSB (双链断裂),DSB是一切基于核酸内切酶的基因编辑的基础,CRISPR/Cas9之所以颠覆了以往的基因编辑技术,就是因为只需要改变sgRNA的5'端序列即可重编程Cas9的序列特异性,设计和操作十分方便。
和其它基于核酸内切酶的基因编辑技术类似,基于CRISRP Cas9的基因编辑技术主要分为两个过程。首先,Cas9蛋白特异性切割目标DNA序列,产生DNA双链断裂;然后,细胞内的DNA修复系统修复双链断裂,在修复的过程中实现DNA序列的改变 (图3)。DNA修复机制分为两类:同源重组 (HR) 和非同源末端连接 (NHEJ)。同源重组修复需要借助修复模板,可以实现精确可控的编辑;NHEJ修复不依赖修复模板,直接将两个DNA末端拼接,但在拼接的过程中会产生碱基插入或缺失 (indels),无法实现精确的编辑 。
正如图3所示,CRISPR/Cas9介导的基因组编辑原理很简单,但是科学家们却玩出了很多不同的花样。针对大肠杆菌,科学家们已经报道了很多基于CRISPR/Cas9的基因组编辑方法 (或protocol),我会把其中具有代表性的方法介绍给大家,这次先介绍几种基于同源重组的方法。
重组工程是利用λ-Red系统介导线性DNA与基因组DNA重组,所用的线性DNA可以是ssDNA (单链DNA) 或dsDNA (双链DNA),线性DNA作为编辑模板携带了所需引入的序列突变。当采用dsDNA作为模板时,可以携带一个抗生素抗性基因作为筛选标记,重组成功的细胞具有对相应抗生素的抗性。当采用ssDNA作为模板时,无法携带筛选标记,只能通过PCR的方式进行筛选。利用抗性基因筛选,事后还要消除抗性基因,同时会留下一段无关序列 (FRT或loxP);利用PCR的方法,需要从大量的克隆中筛选,也比较费时费力。CRISPR Cas9可以作为筛选系统,解决重组工程筛选困难的问题。
【图4】CRISPR/Cas9介导的重组工程 [3]在重组工程中,我们是将线性DNA (单链或双链) 电转到含有λ-Red重组酶的宿主细胞中,线性DNA一旦进入细胞便会在重组酶的驱动下参与同源重组,λ-Red重组酶是在制备感受态细胞的过程中诱导表达的。
在CRISPR/Cas9介导的重组工程中,我们需要将线性DNA和组成型表达sgRNA的质粒一起电转到含有λ-Red重组酶和Cas9蛋白的宿主细胞中 (图4),λ-Red重组酶是在制备感受态细胞的过程中诱导表达的,Cas9蛋白是组成型表达的。λ-Red系统可以整合到Cas9质粒上进行表达,也可以整合到宿主基因组上进行表达。
一般大家认为同源重组先发生,Cas9蛋白切割DNA后发生,CRISPR Cas9蛋白只是作为筛选工具,杀死那些没有经历同源重组的细胞。实际上,Cas9蛋白切割DNA也可以比同源重组先发生;而且,DSB的产生会充分激活细胞的修复机制,提高同源重组的频率。研究者发现,在传统的重组工程中,以ssDNA和dsDNA为模板所得到的重组频率分别是10%和1.1E-4;而在引入了DSB之后,重组频率分别提高到100%和7.5% [3]。不过在这里必须强调的是,重组频率不等于编辑效率。
方法一延续了重组工程的做法,利用线性DNA (PCR产物或合成的寡核苷酸链) 作为编辑模板参与同源重组。我们知道,细胞内含有多种DNA核酸外切酶,当线性DNA进入细胞便会遭到这些酶的攻击,从而开始降解。只有那些在编辑模板降解之前发生重组反应的细胞才可能被编辑。由于线性DNA的降解是从两端的同源臂开始的,只要有其中一个同源臂降解了,重组反应也就不可能发生了。所以,为了提高重组频率,可以适当增加同源臂的长度;也有研究者对编辑模板的两端进行特殊的修饰,从而延缓编辑模板被降解的速率。
然而,线性的编辑模板终究还是不稳定的,要从根本上解决这个问题,就需要将编辑模板整合到质粒上。目前,大部分研究者采用双质粒基因组编辑系统,一个质粒用来表达Cas9蛋白和λ-Red重组酶,另一个质粒用来表达sgRNA,为了实验方便,编辑模板最好整合到sgRNA质粒上,如图5所示。
【图5】编辑模板整合到sgRNA质粒上 [4]在上图所在的那篇文章里,研究者利用这个方法实现了3个基因组位点的同时编辑 [4]。将编辑模板整合到质粒上有三个作用。第一,编辑模板可以免受DNA核酸外切酶的攻击;第二,编辑模板可以随着质粒一起复制,从而增加拷贝数;第三,可以增加转化效率,因为转化一个sgRNA质粒的效率比共转一个sgRNA质粒和一个线性DNA的效率高得多。
将编辑模板整合到质粒上之后,编辑模板不能像在重组工程中那样直接与基因组重组,而必须等基因组被Cas9蛋白切断之后才能与之重组。在这里我解释一下原因:除非是存在特殊的重组位点 (比如loxP) 和作用于这个位点的重组酶 (比如Cre),否则基因组与质粒之间不会发生重组;基因组与编辑模板两者之中至少要有一方是线性的,同源重组才能发生。所以基因组编辑的过程是:Cas9将所有细胞的基因组切断,这时所有细胞都面临死亡的危险,于是每个细胞都用尽全力对自身的基因组进行修复,有些细胞利用同源重组修复成功,脱离了死亡的危险,而那些在一定时间内没有完成修复的细胞则走向了死亡。
重组工程的一个缺点是,编辑成功之后,需要通过位点特异性重组系统 (比如Flp/FRT) 来除去筛选标记 (抗性基因),这个过程费时费力;而且,筛选标记去除之后,还会留下一段FRT序列,无法做到无缝编辑。但是,相比CRISPR/Cas9介导的方法,重组工程也有优点,那就是不需要构建sgRNA质粒。有一种方法能结合两者的优点,做到不需要构建sgRNA质粒,同时也能无缝地去除筛选标记。图6形象地展示了这个方法的原理。
【图6】改进版的重组工程 [5]
这个方法的创新之处在于编辑模板的设计。传统的重组工程所用到的编辑模板由两个同源臂、一个待插入基因 (做基因插入时需要) 和一个两端带有FRT序列的抗性基因组成;而新的方法所用到的编辑模板去掉了FRT序列,添加了一个人为设计的Cas9靶位点 (N20+PAM) 和一个短同源臂 (L-short),这个短的同源臂与左同源臂 (L) 的一部分同源。
该方法分两步进行编辑,第一步与传统的重组工程相似,即把线性编辑模板转入目标菌株,由λ-Red介导同源重组。目标菌株中预先转入了一个质粒,用于表达λ-Red重组酶和Cas9-sgRNA,由两种不同的诱导型启动子 (Plac和PBAD) 控制。制备感受态细胞时诱导λ-Red重组酶表达,但不诱导Cas9表达。编辑模板自带的抗性基因在第一步编辑中作为筛选标记。第一步编辑成功后,取阳性克隆进行第二步编辑。进行第二部编辑时,同时诱导λ-Red重组酶和Cas9-sgRNA表达,Cas9蛋白切割第一步编辑时引入的靶位点,引发基因组内部同源重组 (L-short和L之间)。这一次重组的结果是筛选标记和靶位点被消除,获得无缝编辑产物。
这种方法的编辑效率取决于第一步编辑的效率,因为第二步编辑的效率远高于第一步。由于第一步编辑与传统的重组工程相同,所以从编辑效率上来讲,这种方法没有优势。这种方法的优势是便于去除筛选标记;此外,这种方法还能用于基因组大片段的敲除 (图7)。
【图7】基因组大片段的敲除
结束语:基于CRISPR Cas9的基因编辑方法实在太多,为了控制文章的篇幅不至于过长,今天就先写到这里吧。不过别担心,后续会继续介绍更多的方法,也包括我自己建立的方法,敬请期待哦~
参考文献
https://doi.org/10.1038/s41598-017-16998-8
名称 | 编号 | 规格 | 优惠价格 |
C006M | 1000pmol/盒 | ¥5980.00 | |
C006S | 100pmol/盒 | ¥1480.00 | |
LbaCas12a蛋白 (Cpf1) 2000 | C001M | 2000 pmol | ¥2799.00 |
C001S | 70 pmol | ¥580.00 | |
C005S | 100pmol/盒 | ¥1280.00 | |
C005M | 1000pmol/盒 | ¥4999.00 | |
C015S | 100 pmol | ¥1280.00 | |
C015M | 1000 pmol | ¥4999.00 | |
C002S | 70pmol/盒 | ¥489.00 | |
C002M | 400pmol/盒 | ¥1299.00 | |
C002L | 2000pmol/盒 | ¥4999.00 | |
C003S | 70pmol/盒 | ¥539.00 | |
C003M | 400pmol/盒 | ¥1429.00 | |
C003L | 2000pmol/盒 | ¥5499.00 | |
C004S | 70pmol/盒 | ¥539.00 | |
C004M | 2000pmol/盒 | ¥5499.00 | |
C007S | 250U/盒 | ¥549.00 | |
C007L | 6250U/盒 | ¥8999.00 | |
C007M | 1250U/盒 | ¥2199.00 |
表1. 常用CRISPR/Cas9蛋白及其相关产品
相关阅读
利用CRISPR-CAS9在酵母中高通量构建和分析DNA文库
用RCAS-TVA-CRISPR-Cas9系统编辑体细胞基因组,建立精确的肿瘤模型