用跨物种RNA seq破译宿主与微生物间的相互作用

Alexander
2021-05-18

宿主细胞和细菌细胞之间的相互作用是人类生理学的一个组成部分。

定植细菌可能附着在粘膜表面或与上皮涂层的宿主受体特异性结合,并且必须使其生长和代谢适应相应的微环境。

相反,为了对定植的微生物做出充分的反应,我们的免疫系统必须不断区分有益的细菌和有害的病原体。

此外,人们越来越认识到,与细菌病原体的潜在有害接触不仅取决于该细菌中是否存在毒力特征,而且还取决于其何时、何地以及如何与宿主细胞相互作用。

此外,许多传染病在性质上是多微生物的。构成宿主相关微生物群的大量细菌、真菌和病毒的组成紊乱,这严重影响对感染的敏感性或抵抗力。


复杂性延伸到宿主,其组织和器官包含参与广泛串扰的多种不同细胞类型。此外,空间方面决定了宿主与微生物相遇的结果。

病原体占据宿主体内的特定生态位,在那里它们持续存在、或从那里进行传播,产生截然不同的微环境。

然而,即使在确定的宿主生态位内,遗传上相同的细胞群之间的表型异质性也可导致不同的结果,有时对宿主产生严重影响。

由此产生的宿主-微生物相互作用的变异性可能导致治疗失败和变成慢性复发性感染。

总的来说,为了充分了解宿主-微生物在健康和疾病中相互作用的主要规律,需要高分辨率的方法来捕捉它们在不同尺度上的全部复杂性,从整个生物体的水平到其单个细胞进行研究。


实验性感染系统,例如动物模型和先进的3D体外组织,提高了人们了解人体内生态位情况的能力。

同时,测量相关生物生物活性的技术也在不断改进。例如,感染生物学家目前可以利用不同的全局方法,在系统水平研究宿主-微生物相遇的情况。

在这些方法中,转录组学方法记录转录物的稳态水平,可以提供细胞生理学的快照。

由于其灵敏度,成本效益和通用性,利用下一代RNA测序的转录组测序技术RNA seq在研究宿主-微生物相互作用方面很受欢迎。

自从大约十年前将RNA seq引入感染生物学领域以来,在分析宿主-微生物相互作用方面有三个主要阶段(图1)。

第一阶段,将宿主和细菌细胞彼此物理分离,并分别分析它们的转录组。

第二阶段,开始时意识到其高辨别力和内在的单核苷酸分辨率使得RNA-seq成为同时检测和定量来自不同相互作用生物的转录物的特别强大的技术。伴随着对非编码转录本的重新思考,长期以来被认为仅仅是RNA-seq分析的副产物,揭示了对宿主-微生物相互作用的重要见解。

目前的第三阶段的特点是越来越多地使用单细胞RNA seq(scRNA seq)来分析宿主-微生物相遇中的细胞异质性。


什么是RNA seq技术?


RNA-seq即转录组测序技术,就是用高通量测序技术进行测序分析,反映出mRNA,smallRNA,noncodingRNA等的表达水平。


在这里,我们回顾跨物种转录组学,重点关注细菌病原体或共生体与哺乳动物(主要是人类)宿主细胞的相互作用。

我们首先总结细菌和哺乳动物转录组学和转录组学之间的相似性和差异,然后概述当前的跨物种方法。

我们将这些技术与生物学见解的例子结合起来,包括认识到宿主与微生物相互作用既依赖于环境又高度异质。

我们还讨论了跨物种转录组学的当前局限性,以及如何克服这些局限,特别是在当前scRNA-seq革命的背景下。


真核和细菌转录组特征

生物体的转录组可以提供其生理状态的快照。

在细胞水平上,转录组是来自几个主要类别的大量不同编码和非编码转录物的RNA大杂烩,其中一些正在形成中,另一些已经以其活性形式存在于细胞中,而另一些正在进行衰变。

尽管经历了20亿年的独立进化,原核生物和真核生物之间共享基本的RNA类别(图2)。

在核糖体中起支架和酶功能的核糖体RNA(rRNA)非常丰富,占细菌和真核细胞RNA含量大于80%(在快速生长的细胞中大于95%)。

转移RNA(tRNA)分子将RNA语言(核糖核碱基)翻译成蛋白质信息(氨基酸链),并且通常对细胞RNA含量贡献约10%。


细菌和哺乳动物之间细胞RNA含量的比较

图2:细菌和哺乳动物之间细胞RNA含量的比较。


基因组中不同基因类别比例的扇形图(左;沙门氏菌肠道亚种转录组中的RNA分子。鼠伤寒血清型(上)和人类(下)。

细菌扇形图的面积按指示因子放大;未放大的扇形图反映了沙门氏菌基因组/转录组与人类基因组/转录组的相对大小。用于推断细胞状态的信息性转录物类(mRNAs和调控性非编码RNA)突出显示(*)。

lncRNAs:长非编码rna;miRNAs,microRNAs;rRNA, 核糖体rna;sRNAs,小rna;snRNA,小核rna;snoRNAs,小核仁rna;tRNAs,转移RNA。


信使RNA(mRNA)指导核糖体合成蛋白质。mRNAs占细菌和真核生物细胞总转录组的5%左右,具有特定界的特征。

细菌基因平均为1kb长;然而,它们通常被转录为多顺反子,导致跨多个基因的长mRNA。

一级转录物通常带有5′三磷酸基团,而细菌mRNAs的3′端缺乏延长的Poly(A)延伸(3′多聚腺苷酸化确实发生,但仅限于少数核苷酸,使快速转录物衰变)。

相比之下,在70-250核苷酸(nt)范围内, 真核细胞的mRNAs携带一个7-甲基鸟苷帽和一个Poly(A)尾。与细菌mRNAs不同的是,细菌mRNAs是以翻译就绪的形式产生的,

真核细胞的编码转录物被合成为具有内含子和外显子的前体mRNAs,在输出到细胞质之前,在细胞核中经历剪接(内含子去除)。

成熟的人mRNAs的平均长度约为3kb;由于哺乳动物中只存在单顺反子,因此非常长的编码转录物(>10 kb)是罕见的。


两个界别中都存在某些额外的、专门化的RNA分子,如Y-RNAs,它们是稳定的非编码转录物,与哺乳动物中的Ro60自身抗原和细菌中的Ro60相关蛋白或RNase P(M1 RNA)的RNA成分相关,

大多数非编码RNA只存在于细菌或真核生物中,在那里它们执行调节、酶化或支架功能。

综上所述,这些异质转录物通常对细菌或真核生物转录组的贡献率为5-10%,尽管在某些条件下,细菌非编码RNA的相对比例似乎显著增加。

大多数细菌表达几十到几百种不同的小调控RNA(sRNA)。sRNA可以从基因间非编码基因转录,也可以从mRNA末端切割。

大多数sRNAs通过与相应的mRNAs的短碱基对相互作用,在转录后调控靶基因。


针对真核转录组的非编码RNA包括小核RNA(snRNA)和小核仁RNA(snRNA),它们分别参与前体mRNAs的剪接或rRNAs和tRNAs的化学修饰,并定位于核室。

PIWI相互作用的RNA(piRNAs)以沉默生殖系中的转座因子而闻名,而体细胞中的非编码rna一般分为微rna(miRNAs)和长非编码rna(lncRNAs)。

miRNAs的同质类,其成熟形式约为22nt长,定位于胞浆,在胞浆中,它们以一种类似细菌sRNAs的序列依赖性方式调节靶mRNAs。

相比之下,lncRNAs更具异质性,在操作上定义为长度大于200nt的非编码转录物(但是,请注意,关于其中有多少编码短肽的争论仍在进行中)。

一些lncRNAs带有3′Poly(A)尾,而另一些则不是多聚腺苷酸化的。lncRNAs可能保留在细胞核中,在那里它们可以帮助调节染色质状态,或定位于细胞质,并实现多种功能,例如,维持亚细胞室,作为核糖核颗粒组装的支架或隔离miRNAs。


转录谱之间的差异伴随着细菌和真核细胞RNA含量之间的数量差异(图2)。

大肠杆菌基因组大小约为5 Mbp,而整个人类基因组约为3000个 Mbp。RNA含量也有很大的不同:大肠杆菌细胞平均含有~100 fg的RNA,而人类细胞平均含有30个 pg-RNA,也就是说,要多几百倍。总的来说,这些定性和定量的转录组差异反映在目前细菌和哺乳动物样本的标准RNA-seq方案中。


细菌与真核生物RNA-seq工作流程的比较


RNA seq实验的标准步骤:

  1. 从生物样品中纯化核酸,

  2. 酶消化污染的基因组DNA,

  3. 去除丰富但信息量较少的rRNA,

  4. 将剩余转录物转化为互补DNA(cDNA),

  5. 对cDNA片段进行高通量测序,

  6. 将结果测序读数与参考基因组序列进行比对,并对对应于个体遗传特征的读数进行量化。


RNA-seq提供了各种读数,如下所示。计算同一转录本的所有测序读数可以揭示相应基因的相对表达。

此外,阅读覆盖率分布揭示了一般转录特征,如5′和3′边界、加工位点和操纵子(对于细菌)或内含子-外显子(对于真核生物)结构。

研究人员可以在不同的文库制备管道和RNA-seq平台之间进行选择,这些平台都具有特定的优势和劣势。

细菌和真核表达谱的当前标准是使用Illumina技术,通过合成进行“短读”测序。

在这里,我们仅限于讨论常用的基于细菌和真核生物Illumina的RNA-seq协议的共性和差异(图3a),因为它们最接近发展成多物种RNA-seq方法。


RNA seq/链特异性细菌、哺乳动物或双表达谱的常用方案的基本步骤

图3:链特异性细菌、哺乳动物或双表达谱的常用方案的基本步骤。

a. 单种别RNA-seq。细菌RNA-seq协议(左)基于NEB Next Small RNA Library Prep Set 工作流(NEB Lab),哺乳动物协议(右)基于TruSeq链mRNA工作流(Illumina)。

b. 双重RNA-seq协议。

共性在蓝色框中,差异在红色框中。总的或富集的输入RNA的最小量由各自的用户手册规定。

常规细菌或哺乳动物RNA序列的测序深度估计值分别来自参考文献,双RNA序列的测序深度估计值来自参考文献。

rRNA,核糖体RNA;RT, 逆转录。


转录组固定、细胞裂解和RNA提取

样品处理可能很耗时,并且可能涉及多个处理步骤,特别是在收集特定细菌亚群或宿主细胞的情况下。

鉴于转录组是出了名的不稳定,在这种情况下,RNA的组成应该在防止de novo转录和RNA衰变的固定剂的帮助下进行保存。

目前有多种RNA保存试剂,每种试剂都具有特定的强弱,并且越来越多地用于微生物和宿主微生物转录组。

对几种标准固定方法的系统评估表明,从感染样本中分离出来后,RNA出现了意想不到的大量碎片,这对随后RNA-seq中不同RNA类别的覆盖率产生了影响。

作为一般指南,由于甲醛固定和酒精固定都会对RNA完整性产生不利影响,含有硫酸铵的稳定化试剂,如商业RNAlater(Sigma-Aldrich)或RNAprotect(QIAGEN)通常是整个转录组研究的首选试剂。

然而,在依赖富集排序的实验设置中,建议仔细评估这些RNA保存试剂,因为它们可能会猝灭标记蛋白的荧光信号。


原核细胞和真核细胞的物理化学性质有很大的不同,正如它们在细菌种类之间的区别那样(例如,革兰氏阴性菌和革兰氏阳性菌)。

例如,尽管革兰氏阴性细菌细胞很容易被裂解,也可以与哺乳动物宿主细胞联合溶解,但革兰氏阳性细菌细胞壁的有效裂解通常依赖于酶和/或机械处理。

因此,建议仔细评估跨物种转录组的裂解效率。也就是说,裂解条件需要根据经验确定,要足够苛刻,以有效和均匀地分解样品中的所有细胞类型,同时还要相当温和,不降解细胞RNA。


一旦裂解物准备好,下游RNA分离技术通常在生物体之间可互换,但可能偏向于单个RNA类别,这取决于它们的大小、二级结构和修饰程度。


核糖缺失

核糖体是任何活细胞中含量最丰富的核糖核蛋白颗粒,尽管它们的数量随生长速度而波动,但它们所含的核糖核酸将支配细胞RNA库。

尽管RNA-seq数据中的rRNA读取偶尔被用来推断细菌的复制率,但这种转录物类在细菌和真核RNA-seq中通常被耗尽,从而间接增加了mRNAs和其他信息RNA类的覆盖率。然而,在细菌和真核生物的研究中,核糖缺失策略有部分不同。


在细菌中,rRNA通常在cDNA文库产生之前或过程中被有效去除。最常见的是,它是通过序列特异性的“捕获寡核苷酸”从总RNA池中提取出来的,这些寡核苷酸可以被生物素化(例如,siTOOLs的 riboPOOL)或偶联到磁珠(例如,Lexogen的RiboCop),作为商业或“DIY”试剂盒提供,达到95%以上的消耗效率. 或者在与序列特异性DNA寡核苷酸孵育后,产生的rRNA–DNA杂交用RNase H消化(这一原理纳入了一些NEBNext方案和Illumina的新技术Ribo-Zero Plus)。

最近,我们利用程序化Cas9核酸酶切割, 在cDNA水平引入了细菌rRNA缺失。这种技术通常被称为DASH(通过杂交去除富裕序列),去除rRNA的效率较低,但似乎特别适合于低输入样本。

细菌核糖缺失后剩下的是mRNAs、sRNAs和tRNAs。由于tRNAs需要专门的协议来实现高效的cDNA转化,因此最终将其转化为常规测序文库的主要是mRNAs和sRNAs。


在真核RNA-seq中,通过对多聚腺苷酸化转录物的选择性cDNA启动,主要是mRNAs和lncRNAs(poly(A)-selection是Illumina TruSeq Stranded mRNA 试剂盒的组成部分),rRNA被间接耗竭。

或者,如果非多聚腺苷酸化转录物(例如,poly(A)-negative lncRNAs)也相关,则可使用活性rRNA去除策略,例如商业riboPOOL, RiboCop or Ribo-Zero Plus 技术或定制DASH。

当通过所谓的双重RNA-seq分析细菌和真核宿主细胞的混合物时,这些活性rRNA去除方法也将是首选,下面将进一步讨论。


cDNA文库的制备与测序

主流的Illumina技术提供了最大读取长度为300bp,需要在细菌和真核生物的cDNA转化之前将总RNA样品片段化。

在细菌RNA-seq管道中,通常将RNA衔接子连接到获得的RNA片段的3'末端,随后通过衔接子特异性引物,被用作逆转录(RT)的锚(如NEBNext Small RNA Library Prep Set那样)。

类似的基于衔接子的文库生成方案也可以与按大小选择的、未片段化的真核短RNA组合使用,例如,用于miRNA分析。

相比之下,真核mRNA表达谱通常涉及多腺苷酸化转录物的富集,随后是RNA片段化和RT随机引发(例如,Illumina公司的TruSeq Stranded mRNA kit)。

根据样品类型和RNA-seq实验的范围,存在替代的,定制的文库制备方案。


测序深度要求还取决于RNA-seq实验的期望结果。虽然转录本边界,操纵子或可变剪接结构的准确定位和低丰度转录本的定量需要高测序深度,但细菌和真核生物中的大多数RNA-seq研究实质上是差异表达分析,因此,测序密集程度要低得多。

模拟研究提出了大致5-10百万个非rRNA读数用于细菌中的详尽表达谱,约2000万个非rRNA读数用于哺乳动物。


阅读比对,归一化,量化和功能分析

读取映射和定量的概念在细菌和真核生物RNA-seq之间共享,细节上有所不同。

由于剪接是真核生物独有的分子过程,原核RNA-seq的标准读图仪通常通过消隐来节省计算能力和时间,而真核作图管道严格依赖于剪接的对准器。

对于细菌和真核生物RNA-seq数据,标准化是相似的,最常见的方法假设在两种不同的条件之间大部分基因的表达没有改变。

然而,这种假设对于极端条件的成对比较是失败的,极端条件特别可能在可以改变其转录组的相当一部分的细菌中,并且这种现象促进了针对细菌RNA-seq数据定制的标准化工具的开发。

在实验方面,在RNA-seq方案中加入人工RNA提供了一个使细胞数目正常化的机会。


对于差异表达分析,DESeq2、edgeR和limma/voom算法最受欢迎。

由于这些工具不能分析差异异构体的使用,RNA-seq研究解决真核生物中的选择性剪接依赖于不同的算法。

一旦差异表达的基因(或亚型)被确定,这些变化通常要经过全局途径分析。细菌和真核转录组学都依赖于精心策划的数据库,

如Gene Ontology (GO) or Kyoto Encyclopedia of Genes and Genomes (KEGG)。

此外,对于小鼠或人类RNA序列数据的分析,存在更精细的数据库,专门用于代谢或免疫相关基因集。

总之,尽管在传统的原核和真核RNA-seq协议之间共享基本步骤,但是在过去的十年中,实验和分析管道已经分化,以满足各自靶转录组的特定需要。

因此,体内细菌基因表达的早期RNA-seq分析忽略了宿主转录组,导致细菌从宿主组织中物理富集,下一节将对此进行综述。


为了充分利用宿主和微生物的整体表达数据,需要高分辨率的转录组图谱。尽管小鼠和人类的转录组已经被很好地注释了,但是对于大多数细菌来说,转录组图谱并不精密。

相反,细菌转录组通常是基于计算搜索长度大于100个氨基酸的潜在开放阅读框(ORF)来注释的,但是短的ORF、非翻译区(utr)或非编码RNA基因可能缺失。

因此,一个真正全面的全局表达分析通常需要使用基于RNA-seq的技术,如差异RNA-seq(dRNA-seq;最初应用于革兰氏阴性菌,如幽门螺杆菌和沙门氏菌enterica,后来应用于革兰氏阳性菌,如肺炎链球菌),以全局定位转录起始位点或终止序列(Term-seq)或末端富集RNA序列(Rend-seq), 以确定转录终止位点。

这些参考转录组现在可用于许多有氧运动和厌氧菌。此外,对沙门氏菌肠道亚种进行了研究。

鼠伤寒沙门氏菌血清型从一个叫做SalCom的基因表达图谱中获益匪浅,该图谱在22种体外条件下编辑RNA序列,每种条件都模拟了鼠伤寒沙门氏菌感染周期的特定阶段。

类似地,最近建立的PATHOgenex数据库以32种人类病原体的宿主应激相关体外转录组特征为特征,为感染生物学研究提供了极好的资源。

三十年前,细胞微生物学领域的出现,使人们有必要在细菌病原体的宿主环境中研究其基因表达。

第一种方法是从感染样本中物理富集细菌,然后单独对纯化的细菌进行转录组分析。

例如,受感染的真核细胞用清洗剂进行选择性裂解,释放的细胞内细菌通过差速离心收集。

引人注目的是, 从巨噬细胞中回收的肠道沙门菌的基因表达谱揭示了几种活化的基因,这些基因在SalCom图谱中的22种体外条件中的任何一种中都是沉默的。

因此,从巨噬细胞中恢复的肠道显示,在SalCom图谱的22种体外条件下,有几个激活的基因沉默。

这一发现突出了在培养瓶中重建宿主样条件的困难,并强调了真正的细胞微生物学方法的重要性。

在动物感染模型中也进行了类似的研究,例如,使用与磁珠偶联的抗金黄色葡萄球菌抗体,从骨髓炎小鼠模型中富集这些细菌,设计了啮齿类柠檬酸杆菌的生物发光菌株,可通过生物发光成像从小鼠结肠组织中回收,和铜绿假单胞菌在囊性纤维化患者的痰液中回收。

总的来说,这些研究揭示了这些病原体在其宿主生态位内的新毒力策略和代谢适应。


即使细菌富集,所得的转录组数据仍可能由宿主序列支配。为了使宿主RNA/cDNA背景最小化,可以使用商业试剂盒(例如,MicrobEnrich,Ambion)富集细菌转录物,消耗真核rRNA和聚腺苷酸化转录本。

这被用于霍乱弧菌在婴儿兔和小鼠模型、假结核耶尔森氏菌在小鼠盲肠组织活检样本、感染小鼠结肠组织后柠檬酸杆菌C. rodentium恢复 的体内表达研究。


细菌转录物也可以直接富集。“杂交选择”是指将复杂的cDNA样品与物种特异性的生物素化探针一起温育,以捕获和富集远离宿主cDNA背景的目的cDNA。

杂交选择最近使得近端结肠内的肠道共生脆弱拟杆菌的微环境特异性RNA-seq成为可能。

这首次揭示了微生物群成员在其腔,粘液相关和上皮生态位之间的空间上不同的表达谱。

尽管捕获探针包含完整脆弱拟杆菌的诱饵序列,细菌转录组结构的先验知识可以改进探针设计。

例如,对细菌mRNA和sRNAs(省略rRNA、tRNA或非转录位点)特异的生物素化探针用于研究铜绿假单胞菌或结核分枝杆菌表达谱的技术研究。

值得注意的是,鉴于富集发生在cDNA水平-即样品扩增后-杂交选择非常敏感,可降至单细胞水平。

到目前为止,细菌cDNA的杂交选择已经应用于宿主细胞培养物或用靶细菌单克隆化后的生殖小鼠。

然而,它还应该允许从具有复杂微生物群的常规小鼠的多物种样品中富集靶序列,以揭示共生物种的潜在保护作用。


跨物种RNA-seq方法

RNA-seq技术的稳步改进使研究人员能够超越单侧RNA-seq研究,并在前所未有的细节和生理条件下,研究微生物与其他微生物或宿主细胞(图4)。

以下讨论将集中于宿主相关细菌聚生体内的元转录组学和双RNA-seq,以同时读出细菌和宿主转录组。我们在本节结束时概述了跨物种RNA-seq的设想扩展。


基于RNA-seq的哺乳动物肠道物种间相互作用研究方法的图解概述。

图4:基于RNA-seq的哺乳动物肠道物种间相互作用研究方法的图解概述。

1) 宏转录组学

(2) 肠道病原体和受感染宿主组织的双重RNA-seq

(3) 病毒/细菌共感染(3a)或细菌病原体、竞争共生体及其宿主(3b)的三重RNA-seq

(4) 单个宿主细胞(4a)或单个细菌(4b)的单细胞RNA-seq

(5) NICHE-seq以单细胞分辨率维持局部微环境的空间信息。


宏转录组 Metatranscriptomics

以测序为基础的细菌群落结构分析始于宏基因组学,即16srDNA序列分析(16srdna谱分析),而后才使更敏感的基因组DNA鸟枪测序成为可能。

然而,某一微生物物种或某一基因的丰度并不一定与该物种或基因在群体中的功能贡献相关。

在这方面,宏转录组学因其对微生物组内相互作用的功能洞察而越来越流行。


为了减少样本制备过程中RNA降解的风险,RNA保存试剂通常用于将转录组“冷冻”。

此类药物的标准化使用应促进不同研究之间的交叉比较。对于传统的RNA-seq,使用与单个物种RNA-seq相同的技术时,宏转录组学通常涉及rRNA的损耗。

然而,需要强调的是,由于大多数商业rRNA去除试剂盒针对的是模型细菌,因此它们对于许多非模型物种(例如人类肠道微生物群)的效率可能较低。

以Cas9为基础的核糖体cDNA在宏转录组样本上的去除尚待检验;同样,它应该特别适用于低输入样本,例如,当想要在RNA水平上分析昆虫肠道中的微生物群活动时。


微生物组中基因表达的精确定量需要对同一样本的DNA含量进行RNA校准,就像杂交DNA/RNA-seq分析一样。

为此,DNA和RNA样本的测序深度分别为2000-4000万次Illumina reads。简单地说,所得到的DNA和RNA测序数据是分开处理的,然后将宏基因组数据用于规范化宏转录组的读取。

计算步骤远不止琐碎,为此已经开发了两种正交方法,即分类学分类,涉及参考基因组或从de novo宏基因组组装基因组(MAGs)。


对健康人体肠道微生物组的比较研究表明,宏转录组的特征通常不如其宏基因组对应的个体。

相比之下,纵向分析显示个体的宏转录组随着时间的推移比该个体的宏基因组变化更大,这表明微生物基因表达的主动调节对环境和营养波动的反应,人类肠道微生物群的组成(宏基因组学)和功能(宏转录组学)变化也与传染病的结局有关。


互作转录组测序/双重RNA-seq/Dual RNA-seq

转录组学越来越多地被用来研究各个界别之间的相互作用,尤其是细菌病原体和哺乳动物宿主之间的相互作用。

互作转录组RNA-seq同时测定(胞内或胞外)菌和受感染宿主细胞或组织中的基因表达。

由于真核生物和细菌材料在未经物理分离的情况下一起加工(图3b),互作转录组RNA-seq有望在宿主-微生物相互作用中发现新的相互依赖性。

从技术上讲,互作转录组RNA-seq受益于针对原核生物和真核生物rRNA损耗而优化的商业试剂盒;当涉及到通常只提供微量RNA的临床样本分析时,cDNA水平上的rRNA损耗应该是一个有吸引力的策略。

只要样品中的细菌RNA比例在0.5-10%之间,则总的测序深度与传统哺乳动物RNA序列没有显著差异。


双重RNA-seq已被广泛用于揭示鼠伤寒沙门氏菌与宿主细胞相互作用的情况。

例如,在细胞内沙门氏菌中高度诱导的PinT sRNA的活性如何改变上皮STAT3信号传导。

此外,双重RNA-seq将沙门氏菌RNA结合蛋白ProQ的全局活性与上皮宿主细胞中的MAPK信号传导联系起来,并表明巨噬细胞感染期间产生的沙门氏菌持续存在,保持代谢活跃状态,使其能够重新编程宿主细胞(图5a)。

双RNA seq已经在肺炎链球菌、尿道致病性大肠埃希菌、流感嗜血杆菌细胞培养模型上进行了研究。双RNA seq特别适合于研究专性细胞内病原体,

如沙眼衣原体、结核分枝杆菌(图5b)、东方恙虫(图5c)。

其中许多研究被设计为暂时性研究,以跟踪细菌和宿主基因在相互作用过程中的表达动力学,或比较不同细菌菌株感染之间的表达模式。

PinT sRNA可以很好地说明这些设计的强大,对比感染野生型感染与ΔpinT细菌感染过程,从双RNA-seq图谱可以发现,PinT在沙门氏菌两种主要毒力程序转变中起到转录后计时器的作用,对感染宿主细胞中的基因表达产生巨大影响。


RNASEQ转录分析显示的分子层面的宿主-病原体相互作用。

图5:转录分析显示的分子层面的宿主-病原体相互作用。


双RNA-seq的应用正日益从宿主细胞的单一培养转向体内类感染模型。

例如,一种新的三维肠道组织模型再现了人类胃肠炎对鼠伤寒沙门氏菌感染的反应。

从这个模型中分离出的单个细胞类型的双RNA seq有助于分析细菌感染对上皮和内皮细胞的直接和间接影响。

虽然它证实了先前观察到的沙门氏菌III型分泌系统与STAT3依赖性炎症反应之间的联系,但它揭示了这种反应仍局限于上皮涂层。


小鼠感染模型存在许多细菌病原体,可以很好地再现人类疾病。

一般来说,来自受感染宿主组织或器官的大量RNA-seq数据很难分析,因为改变的转录物丰度代表了差异表达基因和宿主细胞类型组成改变的总和。

尽管如此,双RNA-seq已成功应用于某些感染模型,例如分析派伊尔结,分别感染细胞外病原体假结核菌、金黄色葡萄球菌、绿脓杆菌(图5d)的小鼠的肾脏或肺部。

小鼠肺组织中两种不同肺炎菌株的可比性双RNA-seq表明,细菌棉子糖应用途径中的一个SNP与中性粒细胞的不同募集有关,这可能是导致不同疾病结局的一个潜在原因。

双RNA-seq揭示细菌如何适应、甚至利用人类免疫应答的实例包括:感染细胞外病原体杜克雷嗜血杆菌的人类激发模型或来自细胞内麻风分枝杆菌患者的样本。

其他人利用这项技术对人体皮肤活检样本进行解剖,研究单微生物和多微生物坏死性软组织感染的病理生理学,

揭示体内毒力表达模式,包括单一感染时化脓性链球菌侵袭基因的上调和周围宿主组织中明显的干扰素反应。

相比之下,对来自多微生物活检样本的细菌表达数据进行的类转录组分析显示,与单感染相比,脂多糖(LPS)生物合成基因和粘附(而非侵袭)因子的表达升高。

这些数据进一步表明了共生物种之间的功能专一性,关键代谢途径仅由一部分群落成员表达,因此表明细菌协同作用是多微生物软组织感染致病性的核心。

宿主对多菌感染的反应主要是强烈的促炎症反应(可能是LPS水平升高的结果)和细胞外基质成分基因,表明成纤维细胞被激活。

最终,这些不同的宿主反应模式被用来确定单微生物或多微生物感染的特异性生物标志物,以便进行早期治疗干预。


当对大量组织样本进行测序时,细胞类型特异性基因表达可能在平均表达谱中丢失。

然而,分辨率可以通过两种方式提高:

测序前,通过分离受感染的组织,并分离预定义的细胞类型,或测序后,通过利用细胞类型特异性标记,对异质数据进行去卷积计算。


对感染鼠伤寒沙门氏菌的小鼠结肠组织的原理性研究表明,细胞型富集是普遍可行的。

使用荧光沙门氏菌菌株(表达GFP)与选择性抗体染色相结合,可以分离受感染的和旁观者的结肠细胞。

另一项双重RNA-seq研究使用了细胞类型特异性抗体染色和肺结核感染小鼠肺泡和间质巨噬细胞的富集。

然而,由于分枝杆菌没有荧光,富集的巨噬细胞是受感染和未受感染细胞的混合物。为了不稀释细菌读数,选择性地裂解分离的宿主巨噬细胞,然后富集和机械裂解分枝杆菌细胞,随后汇集宿主和细菌裂解物。

该策略产生了足够数量的细菌reads,以观察肺泡巨噬细胞和间质巨噬细胞中不同的分枝杆菌表达谱,表明肺泡巨噬细胞代表有利的环境,而间质巨噬细胞代表更不利的环境(图5b)。

然而,长时间的组织分离、抗体染色和细胞分选带来了相当大的技术挑战,所有这些都威胁到转录组的完整性。因此,在技术可行的情况下,样品最好在处理程序的早期固定。


作为不同细胞类型物理富集的一种测序后替代方法,对感染假结核菌小鼠的宿主表达特征进行电子解剖,发现大量中性粒细胞浸润到感染的派尔结。

同样,细胞类型特异性表达标记工具被用来分析麻风皮损细胞组成的改变。尽管还没有与感染研究相结合,但是用scRNA-seq进行的更复杂的细胞类型去卷积分析在将来有很大的潜力提高体内双RNA-seq分析的分辨率。


三重RNA-seq

从概念上讲,从双重RNA-seq到任何类型的“多”RNA-seq,研究多微生物感染,特别是不同类型病原体的感染,是一小步。

对于“多”RNA-seq,我们通过最近在体外树突状细胞模型中与人巨细胞病毒和致病真菌烟曲霉共同感染的三重RNA-seq研究来说明。

这种病原体的结合对器官和干细胞移植造成了严重的医学威胁。

完全不同的病毒、真菌和人类基因组促进了三重RNA-seq读数的明确分配,揭示了在共感染和种间表达网络分析期间的协同病原体策略,精确定位了具有生物标记潜力的宿主基因。

同样的方法应该有助于更好地理解细菌和病毒的共同感染,这是常见的,通常会导致比各自单一感染更严重的结果。

了解一种感染如何使宿主更易受另一种感染,有研究前景的模型包括非伤寒沙门氏菌和人类免疫缺陷病毒、链球菌属和流感病毒、衣原体属和人类疱疹病毒。


走向“omni-RNA-seq”方法

增加读取长度,结合更好的计算算法,在分类学水平上解析RNA-seq数据,可以对真核宿主细胞与一种以上细菌相互作用进行RNA-seq研究,理想情况下,可以与数百种不同的细菌物种相互作用,例如胃肠道微生物群。

尽管还没有在一个单步实验中进行,一些针对这种“全”RNA-seq的开创性工作包括:哮喘儿童鼻上皮的转录组学,以及独立获得的鼻微生物组的宏转录组学。

同样,在RNA水平上分析了慢性阻塞性肺疾病(COPD)患者的肺微生物组,并与宿主肺转录组数据进行了整合。

尽管供体存在变异性,但这些研究中患者(8和25名)和对照受试者(6和9名)的数量足以确定与儿童哮喘相关或慢性阻塞性肺病相关的微生物群特征,与宿主免疫系统的调节有关(IL-1α 与哮喘患者有关 ,辅助性T细胞17反应与COPD加重相关)。

总的来说,在过去的5年里,多有机体RNA-seq方法的普及率有了很大的提高。

虽然宏转录组学和双RNA-seq正在成为现代感染生物学的常规技术,但跨物种RNA-seq的发展将通过考虑感染‘ 共生体holobiont’内更多的相互作用伙伴、并追踪其复杂的相互作用网络而继续。对所产生的大量数据进行适当的分析需要复杂的生物信息学工具,并且应该通过实验来探索所预测的多物种相互作用节点的因果关系和功能后果。在这些努力的同时,单细胞转录组学的引入正在动摇感染研究领域,这将是下一节的重点。


单细胞RNA-seq/scRNA-seq

scRNA-seq的最新进展开创了转录组学的新纪元,它已经见证了深刻的新发现,从以前未知的细胞类型或生理状态到随机基因表达的新原理。

与此同时,细胞异质性在宿主-病原体相互作用中发挥着重要作用,例如,病原体利用预先存在的和/或诱导的细胞异质性来建立感染生态位。

同样,病原体本身也可以表现出显著的表型多样性,例如,鼠伤寒沙门氏菌群体的特点是,在宿主细胞接触之前,入侵基因就已经存在双稳态表达,而且在感染过程中,基因表达的变异性甚至加剧。生理学上,这样一种策略使沙门氏菌亚群开始入侵,诱导上皮炎症,进而有益于管腔群。为了捕捉和理解细胞异质性如何决定宿主-微生物相互作用的结果,需要超越批量分析的新转录组学方法。


真核细胞scRNA序列

此时,真核细胞scRNA-seq已经成为一种常规技术,有各种各样的实验和计算管道可供选择,几个商业平台可用。

尽管转录组固定比批量测序方法更不常见,但是第一批RNA保存技术现在与单细胞应用兼容。

不出所料,scRNA-seq也进入了感染生物学领域,这项开创性的工作再次利用鼠伤寒沙门氏菌来研究受感染宿主细胞群体的异质性。

这种细菌在巨噬细胞和体内组织中表现出不均一的复制率。


利用巨噬细胞感染模型,scRNA-seq揭示了沙门氏菌感染的宿主细胞的快速极化,这是通过大样本量的RNA-seq无法检测到的(图5a)。

此外,它还表明,主动复制的沙门氏菌主要存在于抗炎、允许感染的M2类巨噬细胞中,而非复制细菌主要存在于促炎的M1巨噬细胞中,细菌复制率与宿主的干扰素反应程度相关。

随后将scRNA-seq数据与相应的(群体水平)双RNA-seq整合,建立了特异性沙门氏菌毒力因子表达与巨噬细胞极化之间的联系。

换句话说,沙门氏菌主动操纵其宿主细胞,使其向允许复制的状态发展,这种病原体似乎与结核分枝杆菌具有相同的毒力策略(图5b)。

scRNA-seq数据也可用于感染鼠伤寒沙门氏菌或结核分枝杆菌的人类原代免疫细胞。

此外,在鼠伤寒沙门氏菌感染后的小鼠模型的肠上皮内,有一个全面的细胞类型特异性基因表达特征图谱和细胞组成变化。

这些单细胞数据集为研究不同宿主细胞类型的异质性提供了丰富的资源。


大多数体内scRNA-seq协议的一个严重限制是组织分离过程中空间信息的丢失。

然而,空间信息对于解释感染样本的scRNA-seq结果是至关重要的,因为许多细菌病原体在不同的局部微环境中定殖。

通过结合光激活报告基因和scRNA-seq,NICHE-seq克服了这一限制,重建了感染生态位的空间结构。

具体地说,普遍表达光激活GFP变体的转基因小鼠感染淋巴细胞性脉络膜脑膜炎病毒,并通过双光子激光扫描显微镜对B细胞滤泡或腹股沟淋巴结T细胞区的亚区进行光激活,组织被分离,荧光活化细胞分选收集GFP阳性细胞,利用大规模平行scRNA-seq进行分析。


scRNA-seq协议的另一个常见限制是它们依赖寡核苷酸 oligo(dT)-启动的RT,因此丢失了许多非多聚腺苷酸化RNA类的信息,首先是小的真核RNA。

为了克服这一局限性,我们开发了一种基于3′接合器连接的方法,称为Small-seq,它允许在单个哺乳动物细胞中分析miRNAs、tRNA片段和snoRNAs。

另一种方法,Holo-seq,通过添加体外转录载体RNA从单个细胞捕获小RNA物种和mRNAs,这允许传统的文库构建(就像大样本RNA-seq),并且在测序之前涉及cDNA水平的酶消化。

这些反映了以前在批量RNA-seq方面的进展,从以mRNA为中心的方法发展到“全序列”策略。

一些miRNAs和lncRNAs的表达对致病性刺激的反应非常迅速,表明它们是诊断的合适生物标记物。

Poly(A)非依赖性scRNA-seq可以评估这些非编码rna中的一些是否是异质表达的,并且可以作为感染期间特定细胞亚群的生物标记物。


细菌scRNA-seq

虽然单细胞转录组学开始给真核生物带来革命性的变化,但直到最近,技术上的障碍阻碍了它在细菌中的广泛应用。

由于细菌细胞的RNA含量很少,比典型真核细胞的少100倍以上,因此需要一种灵敏的cDNA合成和扩增方法。

目前大多数的真核细胞scRNA-seq方法的检测下限为每细胞10个拷贝,而细菌scRNA-seq必须考虑到较低的mRNAs平均拷贝数(每细胞0.4个拷贝)。

细菌mRNAs的内在不稳定性(半衰期在分钟范围内,而真核生物中则是数小时)是另一个问题,需要快速完成细菌包膜穿孔、细胞裂解和随后的RNA稳定。

然而,最重要的是,在功能性细菌转录物上缺少poly(A)尾阻止了基于寡核苷酸(dT)的RT启动。


随着最近公布的强大的细菌scRNA-seq方案,单细菌转录组学现已成为主要人类病原体研究方法。

一项研究使用 Multiple Annealing and Tailing-based Quantitative scRNA-seq (MATQ-seq) 方法)——最初是为真核细胞scRNA-seq而开发的——在通过细胞分类分离出单个鼠伤寒沙门氏菌和铜绿假单胞菌细胞后对其进行分析。

与已建立的沙门氏菌大量RNA-seq概要进行比较,发现这些单一细菌转录组能够忠实地捕捉生长依赖性基因表达模式。

另一项研究引入了所谓的Prokaryotic Expression profiling by Tagging RNA In situ and sequencing (PETRI-seq) 方法,通过原位标记RNA和测序(PETRI-seq)来研究单个革兰氏阴性(大肠杆菌)和革兰氏阳性(金黄色葡萄球菌)细菌。

PETRI-seq也建立在先前为真核细胞scRNA-seq开发的协议之上;它使用组合索引来对转录物建立原位条形码,这种方法最初被称为“SPLiT-seq”,用于基于分池连接的转录组测序。

MATQ-seq和PETRI-seq都能捕获约200-300个不同的mRNAs/每个细菌,即接近典型细菌细胞中所有mRNAs的5%,但比以前借助荧光报告基因研究单个细菌基因表达异质性的方法高出两个数量级。

截至本文撰写之时,第三项研究报告了近全基因组范围内的微生物scRNA-seq。

该协议称为microSPLiT,也是基于分池条形码(如PETRI-seq)的,并应用于单个枯草芽孢杆菌和大肠杆菌,平均每个细胞检测到超过300个mRNA拷贝。

这三种方法各有优缺点:MATQ-seq似乎比PETRI-seq和microSPLiT具有更低的dropout rate,而分池条形码克服了分离单个细胞的需要,因此提供了更高的吞吐量。

总的来说,虽然有关于真核生物scRNA-seq研究通常需要估计多少个细胞(以及每个细胞的测序读数),但是按照这个指南,细菌scRNA-seq在初期就太多了。

在MATQ-seq和PETRI-seq研究中,分别有19-27个或204-875个细菌,每个条件下分别要测约6000万或约4000万reads/每个文库(没有去除rRNA),但目前尚不清楚这是否足以解决这些样本中细胞变异性达到饱和的问题。

这项 microSPLiT研究分析了超过25000个细菌个体,足以检测出罕见的亚群。经验法则是,被调查样本的复杂性和实验范围最终将决定所需的细胞数和测序深度。


单细菌RNA-seq对感染生物学的影响是多方面的。仅举一个例子,抗药性在各种传染病中是一种危险的威胁,因为各自的细菌能够抵抗抗生素暴露并导致感染复发。

然而,在它们的宿主生态位中,抗药性似乎远非转录惰性。从感染患者中分离的致病抗药性细菌scRNA-seq可以帮助研究它们的体内活性,并提供关于它们何时,如何以及为什么重新激活的功能性见解。

我们期望MATQ-seq,PETRI-seq和microSPLiT方案中技术改进和自动化将有助于细菌scRNA-seq成为研究感染环境中微生物病原体的广泛使用的方法。


结论和未来前景

RNA-seq已成为寻求了解宿主-微生物相互作用引起的基因表达变化的核心方法。

如上所述,基于RNA-seq的方法研究的范围和灵敏度稳步增加。关于范围,可以公平地说,虽然感染生物学的以蛋白质为中心的历史倾向于将RNA-seq研究集中在mRNA表达水平上,但是越来越多的人认识到,许多非编码转录物可能在感染伙伴中(即微生物和宿主)发生变化。

例如,在感染沙门氏菌的人类细胞中,lncRNA谱比mRNA的变化更快,而在细菌本身中,几种高度保守的sRNA可以用作重要调节子的替代物,推断病原体正在经历哪种类型的压力。

除了作为推定的生物标志物之外,越来越多的证据表明,单个非编码RNA影响宿主-微生物相互作用的结果,鼠伤寒沙门氏菌感染模型再次成为代表。

例如,某些宿主lncRNA降低了对沙门氏菌感染的易感性,并且个体miRNA有助于宿主防御该病原体,而其他宿主lncRNA被沙门氏菌积极利用以促进发病机理。

反过来,在感染和清除之间的拉锯战中,沙门氏菌本身就会分发自己的非编码RNA元件库。我们预计未来宿主-微生物相互作用研究的非编码分支将进一步扩大,特别是在专性厌氧病原体和共生体迄今为止尚未深入分析的情况下。


RNA修饰是扩大种间相互作用RNA-seq分析范围的另一个方面。

传统上在rRNA和tRNA分子中已知,现在在许多其他细胞转录物类中报告了RNA修饰,包括细菌和哺乳动物中的mRNAs和调节性非编码RNA。

修饰影响RNA分子的碱基配对、构象和蛋白质结合特性,并已被证明影响细菌的毒力和宿主-微生物的相互作用。

在单面细菌或真核生物研究中,不乏在转录组范围内分析RNA修饰的方法。

这些工作流程通常基于底物RNA样品中特定碱基修饰的化学反应,从而在cDNA合成过程中产生不同的反转录效率。

此外,使用纳米孔的直接RNA测序能够从孔中静电势的动力学变化推断修饰的核糖核苷酸。

因此,它是通用的,并可能提供一种可能性,同时检测两个宿主和微生物在相互作用的表观转录组。


就敏感性而言,细菌体内转录组的获得和分析的持续进展为改善复杂的宿主相关群落中细菌基因表达的认识铺平了道路。

由于scRNA-seq似乎还处于起步阶段,它已经为感染过程中产生的细胞异质性提供了重要见解,现在它适用于真核细胞和微生物细胞。

需要强调的是,可用的方案还可以填补大样本RNA-seq协议(这些协议通常需要纳克至微克范围内的RNA输入)与真正的单细胞研究之间的差距,能够对来自感染器官的活组织检查样本或昆虫感染模型肠道中的少量细菌进行稳健分析。

另一个应用可能是细胞外囊泡的RNA含量的分析,已知其由真核细胞和细菌细胞产生。


时间和空间分辨率也必然会进一步增加。关于破译表达动力学,使用代谢标记的方法允许从预先存在的RNA分子中区分de novo转录,从而更好地理解基因表达的顺序。这种de novo转录跟踪与scRNA-seq结合使用,提供对病毒攻击细胞早期反应的精密时间图像;可以将其应用于细菌细胞感染。

同时,空间转录组学,包括近全基因组荧光原位杂交和直接在保存组织中测序核酸的原位RNA-seq方法正在增加。

NICHE-seq的引入代表了在单细胞分辨率下研究宿主-微生物相互作用的空间方面的突破。

尽管NICHE-seq仅限于局部微环境,但已经实现了将单细胞分辨率的空间/时间表达谱与用于高阶组织重建的成像和生物信息学工具相结合。

目前,技术限制和高成本将这种分析限制在来自小鼠模型的小器官中。然而,在组织或器官尺度上重建四个维度的感染过程的潜力是令人着迷的,并且将为跨学科感染研究提供新的途径。


参考文章

Cross-species RNA-seq for deciphering host–microbe interactions

Alexander J. Westermann & Jörg Vogel

返回首页

相关阅读


mRNA疫苗--疫苗的新时代

lncRNA测序

从RNA衰变率,看老年痴呆症的调控

10X Genomics平台单细胞RNA-Seq测序详解

单细胞RNA测序揭示药物诱导的干细胞背叛

乳腺癌中频繁的miRNA的收敛融合基因事件




分享