深度学习与化学语言模型结合,用于药物从头设计,登Nature子刊

编辑 | X从头药物设计旨在从零开始生成具有特定化学和药理学特性的分子。近日,苏黎世联邦理工学院的化学家开发了一种新的计算机程序,可以根据蛋白质的三维表面快速、轻松地生成活性药物成分。研究人员提出了一种利用基于相互作用组(interactome)的深度学习的计算方法,用于基于配体和结构的类药物分子生成。「这是药物发现的真正突破。」苏黎世联邦理工学院化学与应用生物科学系教授 Gisbert Schneider 说。 这种方法利用了图神经网络和化学语言模型的独特优势,为特定应用的强化、迁移或少样本学习的需求提供了替代方

图片

编辑 | X

从头药物设计旨在从零开始生成具有特定化学和药理学特性的分子。

近日,苏黎世联邦理工学院的化学家开发了一种新的计算机程序,可以根据蛋白质的三维表面快速、轻松地生成活性药物成分。

研究人员提出了一种利用基于相互作用组(interactome)的深度学习的计算方法,用于基于配体和结构的类药物分子生成。

「这是药物发现的真正突破。」苏黎世联邦理工学院化学与应用生物科学系教授 Gisbert Schneider 说。 

这种方法利用了图神经网络和化学语言模型的独特优势,为特定应用的强化、迁移或少样本学习的需求提供了替代方案。

相关研究以《Prospective de novo drug design with deep interactome learning》为题,于 4 月 22 日 发布在《Nature Communications》上。

图片

论文链接:https://www.nature.com/articles/s41467-024-47613-w

计算从头设计包括从头开始自主生成具有所需特性的新分子。化学语言模型 (CLM) 是一种机器学习技术,旨在处理和学习表示为序列的分子结构(例如,SMILES)。CLM 已经在新的生物活性分子的重新设计中发现了许多应用。

尽管已经引入了各种基于结构的从头设计方法,但它们的潜在应用尚未得到广泛探索。

最近的科学家集中在研究分子相互作用网络,称为相互作用组,它涵盖各种类型的相互作用,例如蛋白质-蛋白质、药物-靶标相互作用和药物-药物关系。分析这些相互作用组可以预测以前未知的相互作用,并给出对网络拓扑的深入了解。

深度学习和化学语言模型结合

为了全面研究药物-靶标相互作用组,苏黎世联邦理工学院研究人员提出了一种将 CLM 与基于相互作用组的深度学习相结合的方法。此深度学习模型被命名为 DRAGONFLY(基于药物靶标相互作用的新型生物活性分子的生成)。

对于任何具有已知三维形状的蛋白质,该算法会生成增加或抑制蛋白质活性的潜在药物分子的蓝图。然后化学家可以在实验室合成和测试这些分子。

该算法所需要的只是蛋白质的三维表面结构。在此基础上,它根据「锁与钥匙」原理设计出与蛋白质特异性结合的分子,这样它们就可以与蛋白质相互作用。

该方法采用了由图变换神经网络(GTNN)和利用长短期记忆(LSTM)的 CLM 组成的神经网络架构。

图片

图示:DRAGONFLY 架构和工作流程。(来源:论文)

DRAGONFLY 方法采用图神经网络架构。该方法利用 GTNN 模型对输入分子图进行编码,该分子图表示为配体的 2D 图和蛋白质结合位点的 3D 图。GTNN 将图转换为压缩的一维 (1D) 特征向量。随后,使用基于 RNN-LSTM 架构的 CLM 进行分子生成过程,将该特征向量解码回相应的分子字符串。

与依赖于单个分子迁移学习的传统 CLM 不同,该方法利用基于相互作用组的深度学习,能够跨多个节点整合来自靶标和配体的信息。DRAGONFLY 能够处理小分子配体模板以及 3D 蛋白质结合位点信息。它在不同的化学字母表上运行,不需要通过针对特定应用的迁移或强化学习进行微调。

此外,它能够将所需的物理和化学特性纳入输出分子的生成中。该研究介绍了 DRAGONFLY 在基于结构的从头设计中的前瞻性应用,特别是针对一个或多个特定大分子靶标生成具有所需生物活性特征的配体。

从头药物设计

DRAGONFLY 解决了生成分子设计方法中常见的一些挑战。事实证明,该方法:

与针对药物样配体模板的分别微调的基于 RNN 的 CLM 相比,实现了相似甚至更好的结果。使用 3D 蛋白质结合位点实现基于结构的设计。有效地将所需的物理和化学性质纳入生成的分子中。它能够结合基于结构和基于配体的方法,以及整合所需特性的能力,使其成为药物化学的潜在有用工具。

DRAGONFLY 能够「零样本」构建具有特定生物活性、可合成性和结构新颖性的化合物库。

图片

图示:使用 DRAGONFLY 和定量构效关系(QSAR)模型进行属性转换。(来源:论文)

为了主动评估基于蛋白质结构的药物设计的深度相互作用组学习框架,产生了针对人类过氧化物酶体增殖物激活受体(PPAR)γ 亚型结合位点的潜在新配体。

图片

图示:使用 DRAGONFLY 进行基于结构的从头设计的结果。(来源:论文)

一流的设计是化学合成的,并经过计算、生物物理和生物化学表征。鉴定出有效的 PPAR 部分激动剂,证明其对核受体和脱靶相互作用具有良好的活性和所需的选择性。

图片

图示:蛋白质-配体共结晶。(来源:论文)

配体-受体复合物的晶体结构测定证实了预期的结合模式。

这一成功成果积极倡导基于相互作用组的从头设计在生物有机和药物化学中的应用,从而能够创建创新的生物活性分子。

基于相互作用组的深度学习可作为「零样本」学习的概念验证,可以针对小分子药物发现中的特定应用进一步调整和定制,最终实现在生物有机化学和药物化学中更有效的命中和先导发现。

通过利用数据驱动的深度学习和交互网络,这种方法为基础模型提供了新的途径,从而实现定制的分子设计策略和创新候选药物的发现。

「新算法潜力巨大。我们的研究使药物研究中的生成式 AI 可以进入蛋白质世界。」Schneider 说。对于人体内所有不与任何已知化合物相互作用的医学相关蛋白质来说尤其如此。

相关资讯

超越AF2?Iambic、英伟达、加州理工学院开发多尺度深度生成模型,进行状态特异性蛋白质-配体复合物结构预测

编辑 | 萝卜皮由蛋白质和小分子配体形成的结合复合物无处不在,对生命至关重要。虽然最近科学家在蛋白质结构预测方面取得了进展,但现有算法无法系统地预测结合配体结构及其对蛋白质折叠的调节作用。为了解决这种差异,AI 制药公司 Iambic Therapeutics、英伟达(Nvidia Corporation)以及加州理工学院(California Institute of Technology)的研究人员提出了 NeuralPLexer,这是一种计算方法,可以仅使用蛋白质序列和配体分子图输入直接预测蛋白质-配体复合物

GPT-4驱动的机器人化学家登Nature,自主设计反应并执行复杂实验

编辑 | X基于 Transformer 的大语言模型(LLM)在自然语言处理、生物、化学和计算机编程等各个领域取得了重大进展。但对于在实验室工作的研究人员或那些不熟悉计算机代码的人来说,人工智能方法并不那么容易理解。近日,卡内基梅隆大学的研究团队找到了如何让人工智能系统自学化学的方法。提出了一种基于 GPT-4 的智能 Agent(以下简称 Coscientist),用一个简单的语言提示就可以执行整个实验过程。能够自主设计、规划和执行复杂的科学实验。Coscientist 可以设计、编码和执行多种反应,在湿实验中

准确率82.5%,设计多药理学化合物,加州大学开发新AI平台设计未来抗癌药物

编辑 | 萝卜皮多药理学药物(可以同时抑制多种蛋白质的化合物)在治疗癌症等重大疾病方面有着重要应用,但非常难以设计。为了应对这一挑战,加州大学圣地亚哥分校的研究人员开发了 POLYGON,这是一种基于生成强化学习的多药理学方法,可以模拟药物发现最早阶段所涉及的耗时化学过程。POLYGON 嵌入化学空间并对其进行迭代采样,从而生成新的分子结构;这些药物的回报是预期能够抑制两个蛋白质靶标中的每一个,并且具有药物相似性和易于合成的特点。在超过 100,000 种化合物的结合数据中,POLYGON 能够正确识别多药理学相互