ScienceAl 2024「AI+药物&医疗&基因组&细胞」专题年度回顾

编辑 | 白菜叶2024 年,药物、医疗、基因组学和细胞生物学领域迎来了前所未有的技术突破与创新。 从 AI 驱动的药物设计到基因编辑的精准控制,从单细胞分析到多模态医疗决策,这一年见证了科学与技术的深度融合,为人类健康带来了无限可能。 在药物研发领域,AI 驱动的分子设计与优化方法不断涌现,显著提升了新药发现的效率与精准度。

图片

编辑 | 白菜叶

2024 年,药物、医疗、基因组学和细胞生物学领域迎来了前所未有的技术突破与创新。

从 AI 驱动的药物设计到基因编辑的精准控制,从单细胞分析到多模态医疗决策,这一年见证了科学与技术的深度融合,为人类健康带来了无限可能。

在药物研发领域,AI 驱动的分子设计与优化方法不断涌现,显著提升了新药发现的效率与精准度。

基因与细胞研究方面,单细胞技术与深度学习的结合,为解析复杂生物系统提供了前所未有的工具,推动了精准医学的发展。

与此同时,医疗 AI 在诊断、治疗决策和患者管理中的应用日益广泛,多模态数据整合与智能算法的进步,正在为个性化医疗开辟新的路径。

接下来,ScienceAI 将回顾 2024 年 AI 在药物、医疗、基因、细胞等领域的一些重要研究进展。

温馨提示:点击文章标题可直达文章。

  • 像拼乐高一样设计新药,EPFL、牛津团队AI方法精确设计优化分子3D结构

  • 医疗智能导诊助手来了,复旦大学、复旦附属眼耳鼻喉科医院、中山医院吴淞医院联合发布PIORS

  • 麦吉尔大学Ding Lab基于深度学习开发单细胞水平转座子位点表达定量模型,登Nature子刊

  • 跨物种纳米抗体虚拟筛选,清华集成深度学习和蛋白质语言模型,登Nature子刊

  • 新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发

  • 性能远超当前SOTA,首个可解释RNA的AI植物基础模型来了,整合1124种植物RNA信息

  • 仅总参数量0.1%、单GPU 15分钟完成微调,人类基因组基础模型NT登Nature子刊

  • 精确属性控制,湖大、西电从头药物设计AI方法,登Nature子刊

  • 准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

  • 九大成像模式一键解析,生物医学图像AI再迎突破!微软、UW等BiomedParse登Nature子刊

  • 生成超10万bp的DNA序列,北理工邵斌团队生成式DNA大语言模型,登Nature子刊

  • 登Science封面!基因组基础模型Evo重磅发布,AI解码分子、DNA、RNA和蛋白质

  • 谷歌、MIT等开发多智能体医疗决策框架MDAgents,医学LLM新用法

  • 数字病理与AI辅助诊断,助力肿瘤精准诊疗

  • 类GPT化学语言模型,9秒生成100种化合物,微软AI药物设计平台登Nature子刊

  • 分类准确率达99%,山大团队提出基于对比学习的基因数据分类方法

  • TMI2024 | 阿大、同济等提出TraCoCo,用于3D医学图像半监督分割

  • Nature 子刊,化学语言模型自动设计多靶点配体

  • 成功率提升15%,浙大、碳硅智慧用LLM进行多属性分子优化,登Nature子刊

  • Nature子刊,北大陈语谦团队提出多模态单细胞数据整合和插补的深度学习方法

  • 仅8B参数,可与GPT-4媲美,上交大团队构建多语言医学大模型

  • 化学空间导航仪:流生成式AI引导分子属性控制

  • AI发现超16万种新RNA病毒?阿里云、中山大学合作研究登Cell

  • 精准预测流产风险,上海交大等开发可解释AI算法,为早期预防带来希望

  • 中国科学院团队发布GeneCompass:解析基因调控密码,打造干湿融合新范式

  • Science 发文,高通量蛋白质组学和人工智能的革命

  • OpenAI o1 在医学领域的初步研究,我们离 AI 医生更近了吗?

  • Nature子刊,川大团队机器学习结合MD,预测蛋白质变构,助力药物研发

  • 上交大、复旦中山团队开发糖尿病专用大语言模型,助力个性化糖尿病管理

  • 大语言模型如何助力药物开发? 哈佛团队最新综述

  • 抗体亲和力增强17倍,百奥几何、复旦团队AI方法模拟细微蛋白质互作,登Nature子刊

  • AI蛋白大模型推动生物产业变革,分子之心完成A轮融资

  • 筛选数十亿化合物库,华盛顿大学药物AI虚拟筛选平台,登Nature子刊

  • 效率提高近百倍,山大团队AI新方法解析复杂器官空间组学,登Nature子刊

  • 从头设计「超难」癌症抗体,大卫贝克团队AI生物计算方法的新应用

  • 迈向「多面手」医疗大模型,上交大团队发布大规模指令微调数据、开源模型与全面基准测试

  • 更高分辨率,更经济,深度生成模型与主动学习策略结合,推进大规模单细胞研究

  • 纳米级精度,病毒感染1h内即可检测到,南方医科大学细胞核AI工具登Nature子刊

  • 高效准确预测DDI,福大、元星智药团队解释性药物AI模型,登Nature子刊

  • 识别精度高达76.32%,浙大、之江团队用深度学习加速大规模药物发现和再利用

  • 命中率达60%,AlphaFold预测受体的三维结构,加速药物开发

  • Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?

  • 中科院计算所团队提出CarbonNovo,基于AI进行蛋白质结构和序列的端到端从头设计

  • 从头设计抗体,腾讯、北大团队预训练大语言模型登Nature子刊

  • 糖蛋白组学新方法,复旦开发基于Transformer和GNN的混合端到端框架,登Nature子刊

  • 如何让细胞进行计算?国内四高校提出生物计算元器件设计全新方法,登Cell

  • AI成像新标准,仅1%原始数据可达最佳性能,通用医学基础模型登Nature子刊

  • Nature子刊,诺华团队评测ML模型在靶向蛋白质降解剂中的特性预测

  • 效率高,无需标签,谷歌团队用AI挖掘临床数据,改善基因发现和疾病预测,登Nature子刊

  • 基于Transformer的新方法,可从纳米孔测序中准确预测DNA甲基化

  • 登Science,药物亲和力增加37倍,AI对蛋白、抗体复合物进行无监督优化

  • 生成式 AI 在医疗保健中的前沿应用及其挑战

  • 整合多组学数据,华大基因团队图神经网络模型SpatialGlue登Nature子刊

  • 登Nature子刊,拓扑Transformer模型进行多尺度蛋白质-配体互作预测,助力药物研发

  • 模拟5亿年的进化信息,首个同时推理蛋白质序列、结构和功能的生物学大模型

  • AI小分子药物发现的「百科全书」,康奈尔、剑桥、EPFL等研究者综述登Nature子刊

  • 登Nature,超越GPT-4V,MIT、哈佛开发人类病理学多模态AI「副驾驶」

  • 「复活」古生物分子,AI解决抗生素耐药性,复旦、宾大合作团队两篇论文登Cell和Nature子刊

  • 22个任务超越SOTA,43个任务媲美SOTA,Google推出医学治疗通用大模型

  • 取代昂贵量子方法,南科大AI方法实现蛋白质-药物系统多尺度量子「精炼」

  • 助力药物发现,北京蛋白质组学研究中心提出基于蛋白质序列的深度迁移学习框架

  • 1.8B参数,阿里云首个联合DNA、RNA、蛋白质的生物大模型,涵盖16.9W物种

  • Nature重磅:微软潘海峰华盛顿大学王晟团队发布首个全切片数字病理学模型GigaPath

  • Science发文,量子计算机有望加速材料、催化剂和药物的开发

  • 哥大和耶鲁团队开发新算法,阐明结肠癌耐药机制

  • 准确预测药物-靶点相互作用,江南大学提出深度学习融合GNN新方法MINDG

  • 结合量子特征、2万个分子动力学模拟,新蛋白-配体复合物ML数据集,登Nature子刊

  • 准确率82.5%,设计多药理学化合物,加州大学开发新AI平台设计未来抗癌药物

  • 赛诺菲与OpenAI、Formation Bio合作,加速AI药物发现

  • 多功能RNA分析,百度团队基于Transformer的RNA语言模型登Nature子刊

  • 多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级

  • 预测配体-靶标对的结合亲和力,哈工大开发新SOTA药物表示模型

  • AI 找出限制抗生素耐药性的最佳治疗策略,预防「超级细菌」

  • 91.1% 准确率,性能远超 GPT-4 系列模型,谷歌推出多模态医学大模型 Med-Gemini

  • 首次,西湖大学用蛋白质语言模型定向改造碱基编辑器,登Cell子刊

  • 深度学习与化学语言模型结合,用于药物从头设计,登Nature子刊

  • 新SOTA,仅几个标记基因即可自动标记,复旦大学开发空间转录组学语义注释贝叶斯框架

  • 从基因组到蛋白质组连续翻译,南开大学开发通用跨模态数据分析方法

  • 平均准确率达96.4%,中山大学&重庆大学开发基于Transformer的单细胞注释方法

  • 辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用

  • OpenAI和Moderna合作,推进mRNA医学

  • AI可以改写人类基因组吗?首次由AI从头设计的基因编辑器成功编辑人类细胞中DNA

  • 体外命中率提高75%,Model Medicines&加州大学开发AI驱动的药物发现框架

  • 预测蛋白质共调控和功能,哈佛&MIT训练含19层transformer的基因组语言模型

  • 药物分子设计新策略,微软条件扩散模型DiffLinker登Nature子刊

  • 登Science,药物亲和力<5纳摩尔,加州大学开发特异性药物结合蛋白的从头计算方法

  • Nat. Mach. Intell.|设计超高效疫苗,普林斯顿团队开发首个解码mRNA序列大模型

  • CVPR 2024|FairCLIP:首个多模态医疗视觉语言大模型公平性研究

  • 少量数据实现高通用性,KAIST开发药物设计3D分子生成新框架

  • 从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

  • 优于SOTA,腾讯AI Lab开发双重扩散模型,实现靶标配体3D分子生成和先导化合物优化

  • 优于人类专家,GPT-4 准确注释单细胞类型,成本低且稳健

  • 促进癌症治疗,之江实验室团队开发端到端深度学习模型 DeepAEG

  • 100%化学有效,高度类似药物,川大开发数据和知识双驱动的AI分子生成框架

  • 准确率达95.16%,快速识别恶性肿瘤细胞,厦大和上海交大团队开发域泛化深度学习算法

  • 登Nature子刊,哈佛医学院发布迄今最大计算病理学基础模型,适用30+临床需求

  • 里程碑时刻!David Baker 团队利用 AI 从头设计抗体

  • 可发现药物靶点,哈佛、Hopkins、中国科学院等机构基于Transformer开发了一种可对蛋白翻译动态变化建模的深度学习方法

  • 18个月,开创AI药研先例,Insilico公开其首款AI药物研发全过程,登Nature子刊

  • 更全面、更准确的方法,佐治亚理工学院团队用DL对scRNA-seq数据进行批次效应和条件效应建模

  • 加速药物重新定位再利用,中南大学团队开发基于自适应图卷积网络的新方法

  • 70 亿参数训练,从DNA、RNA、蛋白质到全基因组,生物学通用大模型新标杆

  • 剑桥大学团队用深度学习工具评估纳米抗体的天然性,助力抗体药开发

  • 进行药物靶标亲和力预测,浙大&华科大团队开发扩展图学习卷积网络方法

  • 受 ChatGPT 启发,结合 Transformer 和 RL-MCTS 进行从头药物设计

  • 首次大规模多语言评估,支持7种语言,生物医学领域7B开源LLM

  • 旨在构建首个通用生物学AI模型,前Google DeepMind科学家联手创建Biooptimus

  • GPDRP:基于图 Transformer 和基因通路的药物反应预测多模态框架

  • 制药新工具、有望规避免疫反应,多伦多大学团队用AI框架重新设计参与基因治疗的关键蛋白质

  • 超越基于CNN和Transformer的SOTA框架,多伦多大学团队开发用于生物医学图像分割的通用网络

  • 预测蛋白质动态对接?上海交大&星药科技&中山大学等团队开发新的深度等变生成模型

  • 可多模态数据集成、插补和跨模态生成,中科院&树兰医院&北师大团队开发带有掩码模块的深度生成框架

  • 悉尼大学和香港D24H的研究人员,开发用于亚细胞空间转录组数据分割的自监督学习方法

  • 未来五年AI如何改变各学科?从LLM到AI蛋白设计、医疗保健......

  • 药物-靶标亲和力预测,上科大团队开发了一种Transformer编码器和指纹图谱相结合的方法

  • ICLR2024 | Harvard FairSeg: 第一个研究分割算法公平性的大型医疗分割数据集

  • 罗氏制药和GRCEH团队开发可解释机器学习方法,用于分析治疗性抗体的免疫突触和功能表征

  • 如何利用革命性的蛋白质结构工具来发现药物?AlphaFold 发现了数千种可能的致幻剂

  • 不担心字节跳动、腾讯等大厂竞争,英矽智能CEO Alex Zhavoronkov谈AI药物发现

  • 在24项场景中优于人类医生,Google团队开发基于自博弈的诊断对话大模型

  • Nat.Commun.|山东大学团队基于图transformer开发了一种稀有细胞群组学分析方法

  • NVIDIA 与 Deepcell 合作,加速生成式 AI 在单细胞研究中的应用

相关资讯

仅总参数量0.1%、单GPU 15分钟完成微调,人类基因组基础模型NT登Nature子刊

编辑 | 萝卜皮从 DNA 序列预测分子表型仍然是基因组学中的一个长期挑战,通常是由于注释数据有限以及无法在任务之间转移学习所致。 在这里,英国伦敦 InstaDeep 的研究人员提出了在 DNA 序列上进行预训练的基础模型,称为 Nucleotide Transformer;其参数范围从 5000 万到 25 亿,并整合了来自 3,202 个人类基因组和 850 个不同物种基因组的信息。 这些 Transformer 模型可生成特定上下文的核苷酸序列表示,即使在低数据环境下也能实现准确预测。

空间蛋白质组学:构建复杂组织的尺度图谱

编辑丨toileter当人类前行至远方,我们以自己的脚步衡量出道路,以道路为丝线绘制出这片大地的地图。 而现在,我们将目光望进自己的体内,意图探索生物系统的交错复杂。 与此,空间蛋白质组学为我们带来了更清晰的笔迹,使得人类在对抗疾病的道路上得以踏上更便捷的道路。

分子表征从「图」到「视频」,1.2亿帧、200万分子,湖大分子视频基础模型登Nature子刊

编辑 | KX分子表征已经从「图」扩展到「视频」了。 两年前,湖南大学的研究团队,开发了具有化学意识的深度学习框架 ImageMol,用于从大规模分子图像中学习分子结构,可准确预测分子特性和药物靶点。 现在,该研究团队将 ImageMol 进行了重大升级,提出一个基于分子视频的基础模型,称为 VideoMol,该模型在 1.2 亿帧的 200 万个未标记的类药物分子和生物活性分子上进行了预训练。