量子级精度,静态到动态,微软蛋白MD模拟系统登Nature

编辑 | KX生物世界的本质在于分子及其相互作用的不断变化。 了解生物分子的动力学和相互作用对于破译生物过程背后的机制,以及开发生物材料和药物至关重要。 正如诺贝尔物理学奖得主理查德·费曼(Richard Feynman)的名言:「所有生物体的行为都可以通过原子的颤动和摆动来理解。

图片

编辑 | KX

生物世界的本质在于分子及其相互作用的不断变化。了解生物分子的动力学和相互作用对于破译生物过程背后的机制,以及开发生物材料和药物至关重要。

正如诺贝尔物理学奖得主理查德·费曼(Richard Feynman)的名言:「所有生物体的行为都可以通过原子的颤动和摆动来理解。」然而,通过实验捕捉这些真实的运动几乎是不可能的。

近年来,以 AlphaFold 和 RoseTTAFold 为代表的深度学习方法,在预测静态晶体蛋白质结构方面已经达到了实验精度,相关研究人员获得了 2024 年诺贝尔化学奖。然而,以原子分辨率准确表征动力学仍然更具挑战性,尤其是当蛋白质发挥作用并与其他生物分、药物分子相互作用时。

经典分子动力学(MD)模拟速度快,但缺乏化学准确性。密度泛函理论(DFT)等量子化学方法可以达到化学精度,但无法扩展到大型生物分子。

MD 模拟用于模拟生物分子的时间相关运动。如果你将蛋白质想象成时钟中复杂的齿轮,那么微软研究院科学智能中心开发的从头算精度的生物分子模拟方法 AI2BMD,不仅会将它们捕捉到位,还会观察它们的旋转,揭示它们的运动如何驱动维持生命运转的复杂过程。

相关研究于 11 月 6 日刊登在《Nature》上。

图片

论文链接:https://www.nature.com/articles/s41586-024-08127-z

基于 AI 的从头算生物分子动力学系统

AI2BMD 是一种基于 AI 的从头算生物分子动力学系统。AI2BMD 可以以近似从头算的精度(即量子级的精度),高效地对各类蛋白质进行了全原子模拟仿真。

与密度泛函理论相比,它将计算时间缩短了几个数量级。最新发现可以解锁生物分子建模的新功能,特别是对于需要高精度的过程,例如蛋白质-药物相互作用。

图片

图 1:AI2BMD 流程图。

AI2BMD 采用一种设计新颖的可通用蛋白质碎片化方法,将蛋白质分割成重叠单元,从而创建一个包含 2000 万个快照的数据集,这是 DFT 级别有史以来最大的数据集。基于微软之前设计的通用分子几何建模基础模型 ViSNet,并将其纳入 PyTorch geometry 库。

研究人员使用机器学习训练了 AI2BMD 的势能函数。然后由高效的 AI2BMD 模拟系统执行模拟,其中在每个步骤中,基于 ViSNet 的 AI2BMD 势能以从头算精度计算蛋白质的能量和原子力。通过动力学和热力学的综合分析,AI2BMD 与湿实验室数据表现出更好的一致性。

推进生物分子 MD 模拟

AI2BMD 在以下方面代表了 MD 模拟领域的重大进步:

(1)从头算精度:引入了一种可推广的「机器学习力场」,即原子和分子之间相互作用的机器学习模型,用于从头算精度的全原子蛋白质动力学模拟。

图片

图 2:AI2BMD 与分子力学(MM)对不同蛋白质的能量计算误差的评估。(来源:论文)

(2)解决泛化问题:首次解决了机器学习力场模拟蛋白质动力学的泛化难题,为多种蛋白质提供了稳健的从头算 MD 模拟。

(3)普遍兼容性:AI2BMD 将量子力学(QM)建模从小的局部区域扩展到整个蛋白质,而无需任何关于蛋白质的先验知识。这消除了蛋白质 QM 和 MM 计算之间潜在的不兼容性,并将 QM 区域计算速度提高了几个数量级,使全原子蛋白质的近乎从头算计算成为现实。因此,AI2BMD 为众多下游应用铺平了道路,并为表征复杂的生物分子动力学提供了新的视角。

(4) 速度优势:AI2BMD 比 DFT 和其他量子力学快几个数量级。它支持超过 1 万个原子的蛋白质的从头算计算,使其成为多学科领域中最快的 AI 驱动 MD 模拟程序之一。

图片

图 3:AI2BMD、DFT 和其他 AI 驱动的仿真软件之间的时间消耗比较。

(5)多样化构象空间探索:对于 AI2BMD 和 MM 模拟的蛋白质折叠和去折叠,AI2BMD 探索了 MM 无法探测到的更多可能的构象空间。因此,AI2BMD 为研究药物-靶标结合过程中的柔性蛋白质运动、酶催化、变构调控、内在无序蛋白等提供了更多的机会,更好地与湿实验室实验相结合,为生物机制检测和药物发现提供更全面的解释和指导。

图片

图 4:AI2BMD 从未折叠结构开始折叠 Chignolin 蛋白质,能量误差小于 MM,并且探索了更多 MM 无法检测到的构象区域。

(6)实验一致性:AI2BMD 优于 QM/MM 混合方法,并且在不同的生物应用场景中与湿实验室实验表现出高度一致性,包括 J 偶联、焓、热容量、折叠自由能、熔化温度和 pKa 计算。

展望未来

在生物分子模拟中实现从头算精度具有挑战性,但对于理解生物系统的奥秘以及设计新的生物材料和药物潜力巨大。这一突破证明了 AI for Science 的远见,即利用人工智能的能力革新科学探索。AI2BMD 旨在解决机器学习力场应用中关于准确性、稳健性和泛化的局限性。AI2BMD 通过考虑蛋白质的基本结构,即氨基酸的延伸,在模拟各种蛋白质系统方面提供了通用性、适应性和多功能性。这种方法增强了能量和力的计算以及动力学和热力学性质的估计。

AI2BMD 的一个关键应用是它能够执行高精度的虚拟筛选以发现药物。2023 年,在首届全球 AI 药物开发竞赛上,AI2BMD 取得了突破,预测了一种与 SARS-CoV-2 主要蛋白酶结合的化合物。它的预测精度超越了所有其他竞争对手,稳居第一,并展示了其在加速现实世界药物发现工作方面的巨大潜力。

自 2022 年以来,微软研究院还与全球健康药物研发中心 (GHDDI) 合作,应用 AI 技术设计药物,用于治疗影响中低收入国家 (LMIC) 的疾病,例如结核病和疟疾。现在,微软与 GHDDI 密切合作,利用 AI2BMD 和其他 AI 功能来加速药物发现过程。

AI2BMD 不仅推进了对科学问题的研究,还促进了药物发现、蛋白质设计和酶工程等领域的新的生物医学研究。

参考内容:https://www.microsoft.com/en-us/research/blog/from-static-prediction-to-dynamic-characterization-ai2bmd-advances-protein-dynamics-with-ab-initio-accuracy/

相关资讯

ScienceAl 2024「AI+蛋白&核酸&分子互作」专题年度回顾

编辑 | 萝卜皮2024年,科学界迎来了重要的突破与创新,尤其是在人工智能与结构生物学的结合领域。 正如今年诺贝尔奖颁发所体现的那样,人工智能(AI)技术的迅猛发展正在推动各学科的深度融合,揭示了生命科学研究的新机遇与前景。 在这一年里,AI 与生物学的交汇点愈发引人注目,成为推动现代生物医药、医学研究、生命科学等领域变革的重要力量。

AlphaFold3开源了,诺奖AI工具人人可用,开启生物分子设计新时代

编辑 | ScienceAIAlphaFold3 终于开源了。 六个月前 AlphaFold3 发布的时候,谷歌 DeepMind 没有公布其论文代码,因此引发了学界的巨大争议。 如今,DeepMind 于 11 月 11 日宣布,科学家现在可以免费下载软件代码,并将 AlphaFold3 用于非商业应用。

新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发

编辑 | 萝卜皮准确预测蛋白质-配体相互作用对于理解细胞过程至关重要,目前仍面临着诸多挑战。 中国科学院、浙江大学的研究人员提出了 SurfDock,这是一种深度学习方法,通过将蛋白质序列、三维结构图和表面级特征整合到等变架构中来解决这一挑战。 SurfDock 在非欧几里德流形上采用生成扩散模型,优化分子平移、旋转和扭转以生成可靠的结合姿势。