一种利用下一代测序NGS读取数据来分析蛋白质-蛋白质相互作用PPI的新方法有可能揭示人类细胞中数千种以前未发现的组合。
该方法称为PROPER-seq (protein-protein interaction sequencing, 蛋白质-蛋白质相互作用测序),用RNA条形码标记蛋白质,当可以相互作用的蛋白彼此接近时,RNA条形码形成嵌合序列。
“我们用PROPER-seq方法扫描了大约15000 X15000个蛋白质对,”圣地亚哥加利福尼亚大学的教授Sheng Zhong说,他的实验室开发了这个方法。
在一项对人类胚胎肾细胞、T淋巴细胞和内皮细胞的研究中,Sheng Zhong领导的研究人员发现了超过200000个新的蛋白相互作用。其中,1365项得到免疫共沉淀研究的支持,2480项得到亲和纯化质谱数据的支持。
另外有17638个是通过计算预测出来的,但没有经过实验验证。大约100对和已知的人类合成致死基因对重叠。该研究成果发表在8月的《分子细胞》杂志上。
该方法借鉴了十年来用DNA条形码探测细胞中分子相互作用的经验。
“这个想法很简单,但同时系统地标记成千上万的蛋白质却有一些挑战,”Sheng Zhong告诉Magigen。
一个关键是验证形成缀合的mRNA-蛋白质嵌合体的蛋白质展示步骤对于几乎所有基因都是可行的。
PROPER-seq方法大约在八年前开始,其想法是可以利用与他的实验室对RNA-RNA和RNA-DNA相互作用相似的方式分析PPI。
用一种名为SMART display的技术,类似于哈佛大学教授和诺贝尔奖获得者Jack Szostak开发的mRNA显示方法,产生由mRNA-蛋白质融合标记的细胞。
然后,为了捕获这些蛋白质的相互作用,该方法应用化学方法将暴露的mRNA转化为cDNA,使用邻位连接技术proximity ligation连接相互作用蛋白质的条形码,然后收集嵌合DNA进行测序。
结果是用所谓“多对多”方法分析PPI,而不是“一对一”或“一对多”方法。Proper-seq还加入了其他基于NGS的方法,例如酵母的合成凝集(SynAg)。
加州大学圣地亚哥分校博士后Tao Zhang表示,发现大量以前未知的相互作用的能力是这个技术的重要的亮点。
他说:“真正有趣的是PROPER seq可以揭示许多未知的PPI。基于这项技术,将发现许多不同生物学过程下的许多未知机制。”他以前曾使用酵母双杂交测定法进行蛋白相互作用研究,但是建立起来需要很长时间,而且要付出很多努力。
与其他方法相比,例如基于质谱的方法,成本也可能更低。Sheng Zhong说:“PROPER-seq的成本与RNA-seq实验的规模相似。" 他估计一项实验的样品制备成本约为2000美元,其中不包括细胞系或测序的成本。
他说,用于PPI研究的基于抗体的方法, 使用的抗体花费数百美元,这使得它们在类似规模上成本过高,而所有人类基因的合成基因文库可能花费大约100000美元。
他建议,要实现敏感检测,每个实验需要2.5亿到5亿个读取。他说:“但可以在大约3000万个读取对的深度检测到最强的蛋白相互作用,”
他补充说,对8亿个 paired-end reads 进行测序大约需要3300美元。
该方法没有测试蛋白质对的亲和力。
还有一个可以设置的嵌合读数对总数的阈值,这会影响最终的关联数量。
设置较高的阈值会导致报告的PPI数量较少,但会导致更好的再现性。他说:“门槛越严格,研究之间的重叠就越多。”
这篇论文也没有与其他方法进行直接对比,包括精确性和召回率。
但计算预测的PPI和合成致死基因对重叠证明了PROPER-seq 识别生物相关相互作用的能力。植物研究只是这一方法的可能应用之一。蛋白质相互作用对每一个生物过程都很重要。人们可以在他们感兴趣的细胞类型或组织中使用这一方法。
相关阅读
Magigen T7核酸内切酶I / T7 Endonuclease I