AlphaFold3开源了,诺奖AI工具人人可用,开启生物分子设计新时代

编辑 | ScienceAIAlphaFold3 终于开源了。 六个月前 AlphaFold3 发布的时候,谷歌 DeepMind 没有公布其论文代码,因此引发了学界的巨大争议。 如今,DeepMind 于 11 月 11 日宣布,科学家现在可以免费下载软件代码,并将 AlphaFold3 用于非商业应用。

图片

编辑 | ScienceAI

AlphaFold3 终于开源了。

六个月前 AlphaFold3 发布的时候,谷歌 DeepMind 没有公布其论文代码,因此引发了学界的巨大争议。

如今,DeepMind 于 11 月 11 日宣布,科学家现在可以免费下载软件代码,并将 AlphaFold3 用于非商业应用。

开源地址:https://github.com/google-deepmind/alphafold3

「我们非常兴奋地看到人们用这个技术能做些什么。」DeepMind AlphaFold 团队负责人 John Jumper 说道。

10 月份,Jumper 与 Demis Hassabis 因在该人工智能工具方面的研究获得了 2024 年诺贝尔化学奖。

网友纷纷表示令人难以置信,迫不及待地想看看这将会对生命科学产生什么影响。

图片

最初没开源被批评了

AlphaFold3 与其前身不同,它能够与其他分子协同建模蛋白质。但 DeepMind 并没有像 AlphaFold2 那样同时发布其底层代码,而是通过网络服务器提供访问权限,限制科学家可以做出的预测数量和类型。

至关重要的是,最初 AlphaFold3 服务器禁止科学家预测蛋白质在潜在药物存在下的探索行为。但现在,DeepMind 决定发布代码,这意味着学术科学家可以通过自己运行模型来预测此类相互作用。

那时 DeepMind 表示,仅通过网络服务器提供 AlphaFold3 在实现研究访问权限和保护商业野心之间取得了适当的平衡。那时,DeepMind 衍生公司 Isomorphic Labs 正在将 AlphaFold3 应用于药物研发。

但 AlphaFold3 的发布没有代码或模型权重(通过对蛋白质结构和其他数据进行软件训练获得的参数),引起了科学家的批评,他们表示此举破坏了可重复性。DeepMind 迅速改变了方针,并表示将在半年内推出该工具的开源版本。

现在任何人都可以下载 AlphaFold3 软件代码并将其用于非商业用途。但目前只有具有学术背景的科学家可以根据要求访问训练权重。

图片

AlphaFold3 在医学领域的前景和挑战

AlphaFold3 对药物发现和开发的影响将是巨大的。虽然商业原因目前限制了药物应用,但此次发布所推动的学术研究,将促进科学家对疾病机制和药物相互作用的理解。该系统在预测抗体-抗原相互作用方面的准确性提高可以加速治疗性抗体的开发,这是药物研究中日益重要的领域。

当然,挑战依然存在。该系统有时会在无序区域产生不正确的结构,并且只能预测静态结构而不是分子运动。这些限制表明,虽然像 AlphaFold3 这样的人工智能工具推动了该领域的发展,但它们与传统实验方法配合使用效果最好。

AlphaFold3 的发布代表了人工智能科学向前迈出的重要一步。它的影响将超越药物发现和分子生物学。随着研究人员将此工具应用于从设计酶到开发抗性作物,我们将看到计算生物学的新应用。

AlphaFold3 的真正考验在于,它对科学发现和人类健康的实际影响。随着世界各地的研究人员开始使用这一强大的工具,我们可能会看到科学家在理解和治疗疾病方面比以往更快地取得进展。

图片

第三方「开源版本」

DeepMind 面临竞争:过去几个月,多家公司推出了基于 AlphaFold3 的开源蛋白质结构预测工具,这些工具依赖于原始论文中描述的规范(即伪代码)。

百度和字节跳动分别推出了自己的 AlphaFold3 启发模型,加州旧金山的一家名为 Chai Discovery 的初创公司也推出了类似的模型。

纽约市哥伦比亚大学的计算生物学家 Mohammed AlQuraishi 表示,这些模型的一个关键限制是,与 AlphaFold3 一样,没有一个模型获得药物发现等商业应用许可。不过,Chai Discovery 的联合创始人 Jack Dent 表示,Chai-1 模型可以通过网络服务器用于此类工作。

另一家公司,总部位于旧金山的 Ligo Biosciences,已经发布了无限制版的 AlphaFold3。但它不具备完整功能,没有模拟药物和蛋白质以外的分子的能力。

许多团队都在开发没有这些限制的 AlphaFold3 版本,比如,AlQuraishi 希望在 2024 年年底前推出一个名为 OpenFold3 的完全开源模型。这将使制药公司能够使用专有数据(例如与不同药物结合的蛋白质结构)重新训练自己的模型版本,从而有可能提高性能。

图片

开源至关重要

2023 年,各家公司以不同的方式开放了一系列新的生物 AI 模型。威斯康星大学麦迪逊分校的计算生物学家 Anthony Gitter 并不反对营利性公司加入该领域——只要他们在期刊和预印本服务器上分享他们的工作时,遵守与其他科学家相同的规则。

如果 DeepMind 在科学出版物中对 AlphaFold3 提出主张,「我和其他人希望他们也能分享有关如何做出预测的信息,并以我们可以检查的方式发布 AI 模型和代码。」Gitter 补充道,「我的团队不会在我们无法检查的工具上进行构建和使用。」

DeepMind 科学人工智能主管 Pushmeet Kohli 表示,已经出现了多个 AlphaFold3 复制品,这表明即使没有开源代码,该模型也是可复制的。他补充说,未来他希望看到更多关于学术和企业研究人员日益增多的领域的出版规范的讨论。

AlphaFold2 的开源特性引发了其他科学家的大量创新。例如,最近一次蛋白质设计大赛的获胜者使用人工智能工具设计了能够结合癌症靶标的新蛋白质。Jumper 最喜欢的 AlphaFold2 破解工具来自一个团队,该团队使用该工具识别了一种帮助精子附着在卵细胞上的关键蛋白质。

在分享了 AlphaFold3 之后,Jumper 迫不及待地想看到这样的惊喜出现——即使它们并不总是有成果。「人们会以奇怪的方式使用它。」他预测道,「也许会失败,也许会成功。」

结论

DeepMind 发布的 AlphaFold3 将结构生物学领域带入了新领域。DeepMind 为跨学科研究人员打开了大门,使其能够利用尖端技术,而无需昂贵的基础设施要求。AlphaFold3 在结

AlphaFold3开源了,诺奖AI工具人人可用,开启生物分子设计新时代

视频:2024 年 8 月份 Demis Hassabis 的采访。(来源:DeepMind)

相关内容:

https://www.nature.com/articles/d41586-024-03708-4

https://x.com/Nature/status/1855979598070034605

https://venturebeat.com/ai/google-deepmind-open-sources-alphafold-3-ushering-in-a-new-era-for-drug-discovery-and-molecular-biology/

https://www.maginative.com/article/google-deepmind-makes-alphafold-3-open-source-for-academia/

https://www.marktechpost.com/2024/11/11/deepmind-released-alphafold-3-inference-codebase-model-weights-and-an-on-demand-server/

相关资讯

DeepMind蛋白质设计新工具AlphaProteo,从头设计高亲和力蛋白结合剂,成功率最高88%

编辑 | ScienceAI像 AlphaFold 这样的蛋白质结构预测工具,已经帮助我们深入了解了蛋白质如何相互作用从而发挥其功能,但这些工具无法创建新的蛋白质来直接控制这些相互作用。现在,Google DeepMind 团队推出了一种用于设计「与目标分子结合更紧密」的新型蛋白质的 AI 系统 AlphaProteo。在测试的 7 种靶蛋白上,AlphaProteo 的实验成功率更高,在湿实验室中测试中,9% 到 88% 候选分子成功结合,这比其他方法高出 5 到 100 倍。而且,比现有最佳方法的结合亲和力高出

AI蛋白大模型推动生物产业变革,分子之心完成A轮融资

编辑 | ScienceAI在生物经济智能化升级的浪潮中,业界领先的AI蛋白质设计平台公司分子之心宣布于近期完成 A 轮融资。本轮融资额达数亿元人民币,由谢诺投资、深创投联合领投,商汤国香资本、久奕投资跟投。作为具有行业标杆地位的 AI 生物大分子设计平台公司,分子之心本轮融资将进一步提速 AI 生物基础设施建设。分子之心创始人、国际知名计算生物学家许锦波表示,本轮融资将用于进一步扩大顶级复合型人才团队,深入完善AI蛋白质基础大模型、AI 蛋白质优化设计平台 MoleculeOS 等生物经济共性技术平台,加速AI蛋

普林斯顿王梦迪团队提出蛋白水印方法,助力AI蛋白生成的版权保护与安全

编辑 | 萝卜皮近年来,随着生成式人工智能的发展,蛋白质结构预测和设计的能力显著提高。 然而,蛋白质生成模型在版权保护和生成有害内容(例如生物安全)方面面临着诸多问题。 生物大模型的构建和训练十分昂贵,有着保护模型版权和生成结果的现实需要;同时,需要有技术可靠地追踪和验证生成蛋白质结构,消除潜在的生物安全隐患。