如果把生命比作是精密的机械钟表,那么蛋白质就是内部大大小小的齿轮,作为生命活动的主要承担者发挥着生命基石般的关键作用。蛋白质结构是其功能的基础,如果我们能自由改造蛋白质甚至从头设计全新蛋白质,这将改变甚至颠覆整个分子生物学的发展。
构成生物体的蛋白质都是经过漫长进化才逐渐演化而来,想要无中生有般设计出一种全新的蛋白质十分困难,因为人脑有限的算力无法预测蛋白质的空间结构以及这些结构决定的功能。随着人工智能(Artificial Intelligence,AI)技术的发展,蛋白质的从头设计正在一步步化为现实。
2023年4月20日,著名蛋白质设计专家、华盛顿大学医学院 David Baker 教授及博士后王顺智等人在 Science 期刊发表了题为:Top-down design of protein architectures with reinforcement learning(基于强化学习的自上而下的蛋白质结构设计)的研究论文。
该研究开发了一种基于强化学习的蛋白质设计软件,并证明了它有能力创造有功能的蛋白质。这一突破将开启蛋白质设计的新时代,对癌症治疗、再生医学、强效疫苗和可生物降解日用品都有积极影响。
论文通讯作者 David Baker 教授表示,这项研究表明强化学习可以做的不仅仅是掌握棋盘游戏。当训练解决蛋白质科学中长期存在的难题时,它还擅长于创造有用的蛋白质分子。如果将这种方法被应用到正确的研究问题上,就可以加速各种科学领域的进步。
当下,人工智能(Artificial Intelligence,AI)已经在多个领域大放异彩并深入到我们的日常生活中。从围棋领域的 AlphaGo 到预测蛋白质结构的 AlphaFold,从 AI 绘画再到火遍全网的 ChatGPT,人工智能作为一种新兴的颠覆性技术,正在逐步释放科技革命和产业变革积蓄的巨大能量,并将深刻改变人类的生活和思维方式。
AlphaGo 之所以能够战胜人类顶尖职业围棋选手,依赖于一种名为强化学习的机器学习系统,其计算机程序通过不断地尝试并同时接受反馈来学习如何做出最正确的决策。
回到蛋白质设计上,如果将蛋白质比作一张张围棋谱,那么蛋白质结构域就是一个个围棋定式。从这一点来看,基于强化学习的人工智能软件也能应用到蛋白质的从头设计上来——通过大量的训练,最终获得一个功能强大的新蛋白质设计软件。
自下而上(左)和自上而下(右)的蛋白质组装设计策略
为了创造这样一个可用于蛋白质设计的AI软件,研究团队给计算机输入了数百万个简单蛋白质的序列、结构信息,然后,这一AI软件进行了上万次尝试,并且每次都进行反馈改进,以达到预定的目标——从头设计全新的蛋白质。在这个过程中,计算机以特定的方式延长或弯曲蛋白质,直到学会如何将它们折叠成想要的形状。
自上而下的蛋白质设计策略和计算通道
研究团队通过这种强化学习软件设计了数百种蛋白质,并在实验室中进行基因克隆、蛋白表达和结构测定。为了衡量软件的准确性,他们通过电子显微镜等设备测定了这些AI设计的蛋白质的实际结构,并发现其与软件预测的蛋白质结构非常一致。
研究团队专注于设计由许多蛋白质分子组成的新型纳米级结构,这要求他们设计的蛋白质具有允许纳米结构自组装的化学界面。因此,研究团队观察了AI设计蛋白质的纳米结构,并发现其中每个原子都在预定的位置上。换句话说,这种强化学习软件具有原子精度的设计能力,其预期和实际实现的纳米结构之间的偏差平均小于单个原子的宽度。
所设计的蛋白质衣壳的近原子分辨率的低温电磁结构与设计模型相匹配
此外,研究团队还通过血管细胞的原代细胞模型表明,这种强化学习软件还可以对蛋白质支架结构进行优化。例如,通过使细胞受体更密集地聚集在更紧凑的支架上,从而在促进血管稳定性方面更有效。
通过强化学习软件设计的病毒蛋白衣壳的应用
总而言之,这项发表在 Science 的研究表明,基于强化学习的人工智能软件可以应用到蛋白质设计中,“自上而下”地创造全新的蛋白质,并准确预测其形状结构。这项研究是利用人工智能进行蛋白质科学研究的里程碑,其潜在应用价值是巨大的。通过这项技术,科学家们可以高效创造治疗性蛋白质、疫苗以及其他分子,并将深刻改变疾病治疗、细胞发育和衰老和可生物降解等研究领域的格局。
David Baker 教授在研究领域内素有“蛋白质折叠之父”之称,曾获2021年度科学突破奖·生命科学奖。
David Baker 教授基于实验室研究成果创立了一家名为 Monod Bio 的公司,这也是首个将蛋白质从头设计用于生物传感器和医疗诊断的公司,该公司具有包括 LucCage 生物传感器平台和 LuxSit 从头设计光素酶平台等核心技术。该公司于2022年8月完成2500万美元种子轮融资。
论文链接:
https://www.science.org/doi/10.1126/science.adf6591
https://scitechdaily.com/checkmate-proteins-reinforcement-learning-transforms-molecular-biology/
相关阅读