理论 - AIGC宇宙

谷歌内部项目：大模型 AI 智能体发现了代码漏洞

开源数据库引擎 SQLite 有 bug，还是智能体检测出来的！通常，软件开发团队会在软件发布之前发现软件中的漏洞，让攻击者没有破坏的余地。模糊测试（Fuzzing）是一种常见的软件测试方法，其核心思想是将自动或半自动生成的随机数据输入到一个程序中，并监视程序异常。

英伟达团队机器训练新方法！仅5次演示让机器生成1000个新demo，李飞飞高徒与徒孙联手出品

人类只需要演示五次，就能让机器人学会一项复杂技能。英伟达实验室，提出了机器人训练数据缺乏问题的新解决方案——DexMimicGen。五次演示之后，DexMimicGen就可以直接模仿出1000个新的demo。

UCLA、MIT数学家推翻39年经典数学猜想！AI证明卡在99.99%，人类最终证伪

又一个看似坚固无比的数学理论，被证伪了！最近，UCLA和MIT的研究者证伪了概率论中众所周知的假设——「上下铺猜想」。上下铺猜想（Bunkbed Conjecture）也称为双层床猜想，是渗透理论中的一个陈述，该领域处理的是在图的边随机删除后存在的路径和簇。

大语言模型时代，提示词才是王道：堪比专业翻译软件的提示词

先给大家看看最终效果：商人罗伯特·洛卡西奥，开了个名叫EqualAI的非营利组织，专门应对人工智能开发中那些看不见、摸不着的无意识偏见。这名字听起来倒是光鲜，然而，他却在《Fast Company》上发了一篇文章，讲的是什么“提示工程”的局限。事情的由头不过是一个普普通通的提示语：“写篇750字的文章，说说人工智能怎么成了品牌的‘数字门面’，要写得像《Fast Company》的文章那样。

OpenAI安全大佬，华人科学家翁荔B站首秀！人类如何培养出下一代聪明且安全的AI技术

出品 | 51CTO技术栈（微信号：blog51cto）B站真的啥也能学到！ 11月B站的哔哩哔哩超级科学晚活动，竟然请来了OpenAI的研究副总裁（安全）——翁荔！她是OpenAI的华人科学家，也是ChatGPT的贡献者之一。

为什么多智能体能够解决LLM无法解决的复杂问题

ChatGPT的引入使得大型语言模型(LLM)在技术行业和非技术行业都得到了广泛应用，这种普及主要归因于两个因素：1. LLM作为知识宝库：LLM基于海量的互联网数据进行训练，并定期更新(即GPT-3、GPT-3.5、GPT-4、GPT-4o等)。涌现能力：随着LLM的发展，它们展现出小型模型中不具备的能力。

LLM 比之前预想的更像人类，竟也能「三省吾身」

子曾经曰过：「见贤思齐焉，见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界，对 AI 来说也同样如此吗？近日，一个多机构联合团队证实了这一点。

作者 | 「深度原理」陆婕妤编辑 | ScienceAI现代科学研究中，化学空间的探索是化学发现和材料科学的核心挑战之一。过渡金属配合物（TMCs）的设计中，由金属和配体组成的庞大化学空间为多目标优化的搜索带来了难度。为了解决这一问题，来自「深度原理」 (Deep Principle) 和康奈尔大学的研究者们开发了一种名为 LLM-EO（Large Language Model for Evolutionary Optimization）的新型工作流程算法，释放大型语言模型（LLM）的生成和预测潜能，显著提高了化学空间探索的效率。

成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊

编辑 | 萝卜皮优化候选分子的物理化学和功能特性一直是药物和材料设计中的一项关键任务。虽然人工智能很适合处理平衡多个（可能相互冲突的）优化目标的任务，但是例如多属性标记训练数据的稀疏性等技术挑战，长期以来阻碍了解决方案的开发。在最新的研究中，浙江大学侯廷军团队、中南大学曹东升团队以及碳硅智慧团队联合开发了一种分子优化工具 Prompt-MolOpt。

中国科学院团队发布GeneCompass：解析基因调控密码，打造干湿融合新范式

作者 | 中国科学院多学科交叉研究团队编辑 | ScienceAI近年来，大语言模型（LLMs）已在自然语言、计算机视觉等通用领域引发了新一轮技术革命，通过大规模语料和模型参数进行预训练，LLMs能够掌握语言的共性规律，能够对多种下游任务产生质的提升，已经形成了新的人工智能范式。在生命科学领域，单细胞组学技术的突破产生了大量不同物种细胞的基因表达谱数据，形成了海量的生命「语料」。如果把基因表达值看作单词，组合在一起构成细胞「句子」，进而形成组织「段落」和器官「文章」，并将不同物种作为生命「语种」，利用LLMs相关技

给机器人装上「虫脑」？非Transformer液态神经网络终于来了！MIT CSAIL负责人创业成果

在大模型时代，谷歌 2017 年开创性论文《Attention Is All You Need》中提出的 Transformer 已经成为主流架构。然而，刚刚一家由 MIT 计算机科学与人工智能实验室 (CSAIL) 前研究人员共同创立的初创公司 Liquid AI 却走出了不一样的路线。Liquid AI 表示他们的目标是「探索构建超越生成式预训练 Transformer (GPT) 基础模型的方法」。为了实现这一目标，Liquid AI 推出了其首批多模态 AI 模型：Liquid Foundation Mod

端到端优化所有能力，字节跳动提出强化学习LLM Agent框架AGILE

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

LeCun批评o1根本不像研究，Noam Brown回怼：已发表的研究都是废话

图灵奖三巨头之一 Yann LeCun 又和别人吵起来了，这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一，此前他是 Meta FAIR 的一员，主导了曾火遍一时的 CICERO 项目，在 2023 年 6 月加入 OpenAI 。这次吵架的内容就是围绕 o1 展开的。众所周知，从 AI 步入新的阶段以来，OpenAI 一直选择了闭源，o1 的发布也不例外。这也引来了广大网友的吐槽，干脆叫 CloseAI 算了，反观 Meta，在开源领域就做的很好，o1 的发布，更

新「AI科学家」？MIT整合多智能体，实现材料科学研究自动化

编辑 | 萝卜皮人工智能（AI）的一个关键挑战是：如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中，麻省理工学院（Massachusetts Institute of Technology）原子与分子力学实验室（LAMM）的研究人员提出了 SciAgents，一种可以整合利用三个核心概念的方法：（1）使用大规模本体知识图谱来组织和互连不同的科学概念；（2）一套大型语言模型（LLM）和数据检索工具；（3）具有现场学习能力的多智能体（agent）

OpenAI o1 在医学领域的初步研究，我们离 AI 医生更近了吗？

编辑 | 紫罗大语言模型 (LLM) 在各个领域和任务中都表现出了卓越的能力，突破了我们在学习和认知方面的知识界限。最新模型 OpenAI 的 o1 脱颖而出，成为第一个使用思维链 (CoT) 技术和强化学习的 LLM。虽然 o1 在一般任务中表现良好，但它在医学等专业领域的表现仍然未知。目前医学 LLM 的基准通常集中在一定范围内，例如知识、推理或安全，这使得在复杂的医学任务中对这些模型进行全面评估变得复杂。来自加州大学圣克鲁斯分校、爱丁堡大学和美国国立卫生研究院的研究人员评估了 OpenAI 的 o1 模型在医

上交大、复旦中山团队开发糖尿病专用大语言模型，助力个性化糖尿病管理

编辑 | ScienceAI随着全球糖尿病患病率的逐年攀升，糖尿病已成为全球范围内极具挑战的公共健康问题。据统计，全球约有 10% 的人口受到糖尿病的影响。到 2045 年，全球糖尿病患者人数预计将攀升至惊人的 7.83 亿。然而，由于糖尿病医生短缺、医疗资源分布不均以及患者自我管理能力的不足，糖尿病的管理和治疗仍面临重重困难。如何高效、智能化地管理糖尿病，已成为当前医学界和科技界共同关注的重要课题。为应对这一挑战，上海交通大学清源研究院 MIFA 实验室与复旦大学附属中山医院内分泌科组成的研究团队，联手开发出一款

23亿参数，Transformer架构，NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC

编辑 | KX9 月 23 日，IBM 与 NASA 合作发布了一个用于天气和气候的新型通用 AI 模型 Prithvi WxC，该模型可以在台式计算机上运行，且开源。Prithvi WxC 具有 23 亿参数，使用 MERRA-2 数据集的 160 个变量开发而成。Prithvi WxC 采用创新的 Transformer 架构。研究人员在一系列具有挑战性的下游任务上测试了该模型，即：自回归滚动预测、降尺度、重力波通量参数化和极端事件估计。由于其独特的设计和训练机制，Prithvi WxC 可以解决比现有天气 A

山姆·奥特曼罕见发长文，力推超级智能，百万人围观

如山姆・奥特曼所言，AI 绝非谷歌搜索或家庭作业助手的偶尔替代品，而是将改变人类的进步——当然，一定是朝着更好的方向。今天凌晨，OpenAI CEO 奥特曼罕见地发表了一篇长文博客，标题为《智能时代》（The Intelligence Age）。推特浏览量已经突破了 100 万。奥特曼对 AI 的发展给出了令人难以置信的预言，并宣传了 AI 改变世界的潜力。他表示：AI 绝对不是谷歌搜索或家庭作业助手的偶然替代品，而将推动人类社会朝着更好的方向发展。奥特曼还做出预测，超级 AI 有可能在未来几千天内完成（PS：这个

理论