微生物和病毒之间的竞争刺激了基于CRISPR的适应性免疫的进化,以提供针对感染因子的防护。
在第2类CRISPR/Cas系统中,具有多个功能结构域、单个大小100至200kDa的CRISPR Cas蛋白携带向导RNA,切割DNA或RNA底物。
为了确定在自然界中是否存在更简单,更小的RNA引导蛋白质,我们查询了海量宏基因组数据集,以查找CRISPR阵列和cas1附近的未表征基因,cas1是编码通用CRISPR整合酶的基因。
该分析鉴定了包含cas1,cas2,cas4和先前未识别的编码40-70kDa多肽的基因cas14的多种CRISPR-Cas系统家族(图1A)。
我们最初在比较序列分析的基础上鉴定了24个不同的CRISPR cas14基因变体,这些变体聚集成三个亚组(Cas14a,Cas14b和Cas14c)(图1,A和B以及图1和图2)。
CRISPR Cas14蛋白约为400至700个氨基酸(aa),约为先前已知的2类CRISPR RNA引导酶(950至1400 aa)大小的一半(图1,C和D)。
尽管鉴定的CRISPR Cas14蛋白表现出相当大的序列多样性,但所有蛋白都通过预测的RuvC核酸酶结构域的存在而结合,所述RuvC核酸酶结构域的组织是V型CRISPR Cas DNA靶向酶的特征(图1D)。
图1 CRISPR Cas14基因组位点的结构和系统发育图
(A) V型CRISPR系统的系统发育树。新确定的微型CRISPR系统以橙色突出显示。
(B) C2c10和CRISPR-Cas14系统的代表性基因座架构。
(C) 与CRISPR Cas12a至CRISPR Cas12e和CRISPR Cas9相比,CRISPR Cas14a至Cas14c系统的长度分布。
(D) 与CRISPR Cas9蛋白和CRISPR Cas12a蛋白相比,CRISPR Cas14a蛋白的结构域组织。颜色指示了核酸酶结构域(RuvC和HNH)。蛋白质长度按比例绘制。
我们鉴定的CRISPR Cas14蛋白几乎完全发生在DPANN内,DPANN是一种共生古细菌的超系,其特征在于小细胞和基因组大小。系统发育比较表明,Cas14蛋白种类繁多,与C2c10和C2c9相似,C2c10和C2c9是细菌RuvC结构域蛋白家族,有时在CRISPR阵列附近发现,但不与其他cas基因一起(图1B)。该观察结果和c2c10,c2c9和cas14蛋白的小尺寸使得这些系统不可能作为独立的CRISPR效应子起作用。
基于它们与负责创建感染遗传记忆的保守基因(cas1、cas2、cas4)接近,我们探索了CRISPR-Cas14蛋白系统是否能够主动获取DNA序列到其CRISPR阵列中。
多个CRISPR Cas14基因座的集合元基因组连续DNA序列(contigs)显示,其他相同的CRISPR系统在其CRISPR阵列中表现出多样性。
这些结果与对新感染的主动适应是一致的,尽管没有纵向取样,这些数据也可以用替代的生物学机制来解释(图2A)。
有证据表明获得了新的DNA序列,这使得我们设想这些CRISPR/Cas14基因座编码具有核酸靶向活性的功能酶,尽管它们的大小很小。
为了验证这种可能性,我们首先研究了RNA成分是否来自CRISPR Cas14基因座。对来自包含CRISPR Cas14a蛋白的本地古细菌宿主的RNA(图2B),分析环境转录组测序数据。
除了crispr RNA(crRNAs)外,一个高度丰富的非编码RNA被定位到CRISPR cas14a蛋白和相邻CRISPR阵列之间的~130碱基对序列上。
值得注意的是,该转录本的3′端主要与crRNA的重复片段互补(图2C),就如与CRISPR Cas9、Cas12b和Cas12e CRISPR系统相关的反式激活CRISPR RNA(tracrRNAs)所观察到的。
在这些先前研究的系统中,双链RNA切割酶核糖核酸酶III(RNase III)产生成熟的tracrRNAs和crRNAs,但是在含有重建基因组的CRISPR cas14蛋白中不存在编码RNase III的基因,并且当进行生物化学测试时,CRISPR Cas14a蛋白也没有切割其自身的pre-crRNA。
这些观察结果表明,CRISPR相关RNA加工的另一种机制存在于这些宿主中。
图2 CRISPR-Cas14a主动适应并编码tracrRNA。
(A)CRISPR Cas14b4和Cas14b14与CRISPR重复序列的间隔区多样性以棕褐色绘制,不同颜色显示不同的间隔区。
(B) Metatranscriptomic读取映射到CRISPR Cas14a1和Cas14a3基因座。插图显示了最丰富的重复序列和间隔序列的扩展视图。nt,核苷酸。
(C) 计算机预测CRISPR Cas14a1 crRNA和tracrRNA的结构。值得注意的是,在宿主基因组中未鉴定出RNase III直向同源物。
(D) 由RNA和蛋白质组成的各种CRISPR复合物质量的分数。
为了测试CRISPR Cas14a蛋白和相关RNA组分是否可以在异源生物体中组装在一起,我们将质粒引入含有最小CRISPR Cas14a基因座的大肠杆菌中,所述基因座包括cas14基因,CRISPR阵列和含有推定tracrRNA的基因间区域。
来自细胞裂解物的CRISPR Cas14a蛋白的亲和纯化和共纯化RNA的测序揭示了高度丰富的成熟crRNA以及推定的tracrRNA,尽管其相对丰度低于环境转录组学所显示的,表明Cas14与crRNA和tracrRNA相关。
组装的CRISPR Cas14a蛋白-tracrRNA-crRNA颗粒的质量计算为: RNA占重量的48%,而化脓性链球菌Cas9(SpCas9蛋白)仅为17%,新弗朗西斯菌Cas12a(FnCas12a)仅为8%(图2D),显示了RNA在Cas14a复合体结构中的核心作用。
已知的2类CRISPR系统需要称为原型间隔区相邻基序PAM的短序列来靶向双链DNA(dsDNA)。
为了测试CRISPR Cas14a是否需要PAM、并且可以进行dsDNA干扰,我们用含有随机PAM区的dsDNA质粒转化表达最小Cas14a基因座的大肠杆菌,所述随机PAM区紧邻与Cas14阵列中的靶编码序列(间隔区)匹配的序列。
值得注意的是,在大肠杆菌转化体中未检测到PAM序列的消耗,表明CRISPR Cas14a蛋白系统不能靶向dsDNA,可以在不需要PAM的情况下这样做,或者在该异源宿主中无活性。
我们接下来测试了纯化的Cas14a-tracrRNA-crRNA复合物是否能够在体外进行RNA引导的核酸切割。
目前所有针对2类干扰复合物的重组DNA都能够识别dsDNA和单链DNA(ssDNA)底物。
我们将纯化的Cas14a-tracrRNA-crRNA复合物与带有与crRNA指导序列或非互补ssDNA互补的20个核苷酸序列的放射性标记的靶寡核苷酸(ssDNA,dsDNA和ssRNA)一起温育,
并且我们分析了这些底物的Cas14a蛋白介导的切割。仅在存在互补ssDNA底物的情况下,才检测到切割产物(图3A),并且切割取决于tracrRNA和crRNA的存在,其也可以组合成单个指导RNA(sgRNA)(图3B)。
缺乏可检测的dsDNA切割表明Cas14a蛋白选择性地靶向ssDNA,尽管一些其他宿主因子或序列要求可能使天然宿主中的dsDNA识别成为可能。
CRISPR Cas14a蛋白 RuvC结构域中保守活性位点残基的突变消除了切割活性,暗示RuvC是负责DNA切割的结构域。
此外,CRISPR Cas14a DNA切割对RNA组分的截短敏感,其长度短于天然产生的序列。
这些结果证实CRISPR Cas14a蛋白是迄今为止证明进行可编程RNA引导的DNA切割的最小的2类CRISPR效应子。
图3 CRISPR-Cas14a蛋白是RNA引导的DNA内切核酸酶。
(A) 靶向ssDNA,dsDNA,ssRNA和脱靶ssDNA的Cas14a1的切割动力学。
(B) 在各种RNA组分存在下,与靶ssDNA结合的Cas14a RNP图和放射性标记的ssDNA的Cas14a1切割动力学。
(C) 通过Cas14a1指导序列平铺ssDNA底物。
(D) 用活化的Cas14a1切割ssDNA病毒M13基因组。
虽然我们无法在体内鉴定dsDNA PAM,但我们通过在ssDNA底物上平铺CRISPR Cas14a向导, 来测试Cas14a蛋白是否需要PAM用于体外ssDNA切割(图3C)。
尽管与这些不同向导的靶标相邻的序列发生变异,我们观察到所有四个序列的切割。值得注意的是,切割位点发生在ssDNA的引导互补区域之外,并响应于引导结合位置而移入区域(图3C)。
这些数据表明Cas14a蛋白是靶向CRISPR内切核酸酶的ssDNA,其不需要PAM来激活。
基于CRISPR Cas14a蛋白切割靶向异源双链体的crRNA/DNA之外的观察结果,我们假设Cas14a可能具有靶向激活的非特异性ssDNA切割活性,类似于含有RuvC的酶Cas12a。
为了测试这种可能性,我们将Cas14a-tracrRNA-crRNA与互补的激活DNA、以及与Cas14a-crRNA或激活没有序列互补性的M13噬菌体ssDNA的等分试样一起温育(图3D)。
M13 ssDNA迅速降解为小片段,这个活性被保守的Cas14a蛋白 RuvC活性位点突变消除,表明Cas14a的活化导致非特异性ssDNA降解。
然而,当我们在大肠杆菌中异源表达CRISPR Cas14a蛋白时,我们无法观察到Cas14a介导的对ssDNA噬菌体ΦX174的干扰,可能是由于大肠杆菌和Cas14a的天然古细菌宿主之间的差异。
为了研究Cas14a蛋白对靶标依赖性非特异性DNA切割活性的特异性,我们采用了荧光猝灭(FQ)测定法,其中染料标记的ssDNA的切割产生荧光信号(图4A)。
当Cas14a蛋白与各种指导RNA-靶标ssDNA对一起温育时,仅在存在同源靶标的情况下观察到荧光信号,并且显示出对更长的含FQ底物的强烈偏好(图4A)。
我们接下来通过在各种ssDNA底物中的靶区域上平铺2个核苷酸错配来测试Cas14a错配耐受性。
令人惊讶的是,ssDNA靶标中间附近的错配强烈抑制Cas14a蛋白活性,揭示了与dsDNA靶向CRISPR Cas系统观察到的PAM近端种子区域不同的内部种子序列(图4B)。此外,含有强二级结构的DNA底物导致Cas14a蛋白的活化减少。ssDNA底物的截短也导致减少或不可检测的反式切割。总之,这些结果表明了一种不同于dsDNA靶向2类CRISPR系统的保真度机制,可能使用了类似于ssRNA靶向Cas13a蛋白酶的机制。
图4通过CRISPR Cas14a蛋白检测高保真ssDNA SNP。
(A)用 Cas14a1检测单链ssDNA的荧光猝灭FQ实验,以及不同长度荧光猝灭底物的裂解动力学。
(B) Cas14a1的切割动力学,错配平铺在基板上(单个点代表重复测量)。kObs,观测速率常数。
(C) Cas14-DETECTR 策略和HERC2眼色SNP图。
(D) T7核酸外切酶的滴定及对Cas14a-DETECTR的影响。Bkgd,背景。
(E) 用Cas14a-DETECTR检测蓝眼和棕眼个体唾液样本中的单核苷酸多态性,并与用Cas12a蛋白检测单链ssDNA进行比较。
CRISPR Cas12a蛋白的靶标依赖性,非特异性DNase酶活性可以用作DNA检测平台(DNA内切核酸酶靶向的CRISPR反式报告子,或DETECTR)。
尽管Cas12a蛋白在区分ssDNA底物方面表现出低保真度,但Cas14a蛋白需要种子区域中的互补以用于ssDNA底物识别。这种改善的特异性提高了使用Cas14a蛋白进行DNA单核苷酸多态性(SNP)的高保真检测,而不受PAM序列限制的可能性。
为了验证这一想法,使用含硫代磷酸酯(PT)的引物扩增了DNA底物,以保护一条链免受核酸外切酶的降解。
加入T7核酸外切酶后,未修饰的链被降解,留下可被Cas14a蛋白检测到的ssDNA底物(图4,C和D)。
作为原理证明,我们旨在检测人HERC2基因,该基因包含负责眼睛颜色的SNP。我们使用上述PT扩增方法,从蓝眼和棕眼个体的人唾液中的DNA扩增了HERC2基因。
当用靶向蓝眼SNP的指导RNA编程时,Cas12a蛋白不能区分两个ssDNA靶标,在两种情况下都表现出强烈的反式活性,
而Cas14a蛋白在识别带有针对棕色眼睛样本的近背景信号的蓝眼SNP时表现出强烈的活性(图4E)。
Cas14-DETECTR开发的产品允许基于CRISPR的医学和生态学上重要的ssDNA病原体的检测,以及SNP的高保真检测,而不受PAM序列的限制。
在宏基因组数据中对紧凑型V系统的进一步研究揭示了大量多样性的CRISPR系统,如Cas14a至Cas14c,
包括编码含有相邻Cas蛋白的短的RuvC的蛋白质的基因河CRISPR阵列。我们在各种未培养的微生物中发现了另外20个这样的系统,这些系统聚集成五个主要家族, Cas14d至Cas14h。
排除与cas12b蛋白相关的cas14g,cas14蛋白类基因在V型效应系统发育上形成单独的进化枝,表明这些家族是从TnpB的独立驯化进化而来的,TnpB是转座酶相关蛋白,这种可能是V型CRISPR效应子的进化祖先。
其相关cas1基因的系统发育重建表明,它们对于cas14亚型也具有不同的起源。
总之,我们确定了属于8个家族(Cas14a至Cas14h)的38个CRISPR-Cas14蛋白系统和另外8个无法与我们的分析聚类的系统(称为Cas14u)。目前,一些成熟的CRISPR Cas14蛋白产品已经开发出来,例如Magigen Cas14a1系列。
Cas14蛋白的小尺寸及其与V型效应蛋白的相似性表明,RNA引导的ssDNA切割可能已经作为祖传的2类CRISPR系统存在。
在这种情况下,一个小的、驯化的TnpB类ssDNA干扰复合物可能随着时间的推移获得了额外的结构域,逐渐改善了dsDNA的识别和切割。
与此假设相关,这种较小的Cas9蛋白直向同源物跟比较大的对应品种相比,表现出更弱的dsDNA靶向活性,但保留了强力切割ssDNA的能力。
除了进化意义之外,CRISPR Cas14蛋白特异性靶向ssDNA的能力表明,在防御ssDNA病毒或通过ssDNA中间体传播的移动遗传元素方面发挥作用。
靶向ssDNA的CRISPR系统在某些生态系统中特别有利,其中ssDNA病毒构成绝大多数病毒丰度。
这些微型CRISPR蛋白可以进行靶向DNA切割的意外发现,突出了隐藏在非培养生物中的CRISPR系统的多样性。
正在进行的对这些少数微生物谱系的探索,可能会继续揭示微观世界生存竞争、新的意想不到的发现,并带来有价值的、CRISPR技术的持续发展。
参考文献
Programmed DNA destruction by miniature CRISPR-Cas14 enzymes
Lucas B. Harrington,David Burstein,Janice S. Chen, Paez-Espino, Enbo Ma, Isaac P. Witte, Joshua C. Cofsky, Nikos C. Kyrpides, Jillian F. Banfield, Jennifer A. Doudna
相关阅读
CRISPR Cas14蛋白和CasΦ蛋白让基因组编辑如虎添翼