训练 - AIGC宇宙

英伟达迷你超算遭友商嘲讽：宣传FP4算力，实际“不如买个游戏电脑”

老黄在CES上发布的迷你超算Project DIGITS，开启了AI超算的PC时刻。但随即也引发了不小争议，还遭到了大佬的贴脸嘲讽。在AMD和英特尔都工作过的芯片设计专家Raja Koduri实名吐槽道：FLOPs除以4，价格翻倍，这就是在CES上stay grounded的秘诀。

让Qwen2.5 7B超越o1，微软干的！MSRA推出小模型数学推理自我进化新方法

7B参数的Qwen2.5数学推理表现超过o1-preview，这是怎么做到的？！靠的就是MSRA最新的创新算法，rStar-Math。

个人跑大模型，英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好？

前些天，英伟达发布了一大堆东西，其中包括一款 AI 超级计算机 Project DIGITS，机器之心也在第一时间进行了报道，参阅《RTX5090 震撼发布，国行 16499 元起，黄仁勋「美国队长」pose 亮翻全场》。在这篇文章的评论区，一位读者的问题引发了不少争议。虽然该问题的最高赞回复表示这是「英伟达被黑得最惨的一次」，但实际上使用 Mac Mini 作为个人的大模型运行平台并不是什么罕见操作。

真机数据白采了？银河通用具身VLA大模型已充分泛化，预训练基于仿真合成大数据！

近日，英伟达CEO黄仁勋在今年CES的演讲无疑让整个科技圈为之沸腾。他先是向全世界展示了搭载Blackwell新架构的新一代卡皇RTX 5090，然后介绍了英伟达对于人形机器人发展的期盼和投入，并以令人印象深刻的画面结尾——「来自银河通用的全场唯一一台轮式具身大模型机器人Galbot G1将RTX 5090缓缓托起。」发布会结束后，黄仁勋更是第一时间亲自来到银河通用所在的展区，与Galbot机器人进行真机互动。

今天起，汉字也能AI视频生成了！《滕王阁序》直接拿捏到位了

“汉字”这个难关，今天终于被AI视频生成给拿下了！话不多说，我们直接先来看效果：这个“福”字，就这样被AI水灵灵地一笔一划滴了出来。再如下面这个例子，我们的Prompt是：有汉字“量子位”，古风。

具身智能新高度！智元机器人推出全球首个4D世界模型EnerVerse

如何让机器人在任务指引和实时观测的基础上规划未来动作，一直是具身智能领域的核心科学问题。然而，这一目标的实现受两大关键挑战制约：模态对齐：需在语言、视觉和动作等多模态空间中建立精确的对齐机制。数据稀缺：缺乏规模化、多模态且具备动作标签的数据集。

如何证明一个数是无理数？他们找到了欧拉和黎曼错过的证明，华人数学家唐云清参与

我们都知道，实数分为有理数和无理数，它们的定义也都很明确。但令人惊讶的是，其实很难证明一个数究竟能否写成分数形式。而现在，这个古老的问题有了一种广泛适用的新方法。

OpenAI智能体曝本月诞生！比谷歌Anthropic慢，竟是担心prompt攻击

2025年，智能体将是AI领域最激烈的战场。然而，一直在AI领域「独占鳌头」的OpenAI，却迟迟没有出手。不过，外媒最近曝出了一条好消息——OpenAI可能在本月就会发布自家的「计算机操作智能体」！

纯视觉方案，精准操控电脑和手机！港大Aria-UI登顶，超越Claude 3.5

在当今数字时代，智能助手已成为处理跨平台任务的不可或缺工具。然而，如何将用户的自然语言指令精准映射（grounding）到界面元素一直是该领域的核心挑战。传统解决方案主要依赖调用无障碍API、解析HTML源码或提取后台数据，这些方法普遍存在效率低下、信息不完整、兼容性差等显著痛点，严重制约了自动化技术的广泛应用。

AAAI 2025 | 大模型推理加速新范式：加速比高达3.51倍、成本降至1/3

近日，中国电信翼支付针对大模型推理加速的最新研究成果《Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregressive Drafting and Custom-Designed Decoding Tree》已被 AAAI 2025 接收。论文中提出的 Falcon 方法是一种增强半自回归投机解码框架，旨在增强 draft model 的并行性和输出质量，以有效提升大模型的推理速度。 Falcon 可以实现约 2.91-3.51 倍的加速比，在多种数据集上获得了很好的结果，并已应用到翼支付多个实际业务中。

黄仁勋圈重点的世界模型平台是个啥？技术报告全解析，华人贡献中坚力量

AI 的下一个前沿是物理。在昨天的 CES 发布会上，英伟达 CEO 黄仁勋通过一个名为「Cosmos」的平台点明了这一主题。简单来说，Cosmos 是一个世界模型平台，上面有一系列开源、开放权重的视频世界模型，参数量从 4B 到 14B 不等。

o1也会「想太多」？腾讯AI Lab与上海交大揭秘o1模型过度思考问题

本文的共同通讯作者为涂兆鹏和王瑞，涂兆鹏为腾讯专家研究员，研究方向为深度学习和大模型，在国际顶级期刊和会议上发表学术论文一百余篇，引用超过9000次。担任SCI期刊NeuroComputing副主编，多次担任ACL、EMNLP、ICLR等国际顶级会议领域主席。王瑞为上海交通大学副教授，研究方向为计算语言学。

奥特曼家里也内讧了！亲妹告他长期虐待，刻意隐瞒遗产；家里其他人联名否认

我去，OpenAI CEO奥特曼的亲妹妹，一纸状书，把她亲哥给告了！想不到让奥特曼再次陷入舆论危机的矛头，这次居然来自家庭内部，来自小他9岁的妹妹安妮·奥特曼（Annie Altman）。事态紧急，奥特曼立刻联名母亲和两位弟弟，共同发布回应：不，指控不实。

Tokenization，再见！Meta提出大概念模型LCM，1B模型干翻70B？

最近，受人类构思交流的高层级思路启发，Meta AI研究员提出全新语言建模新范式「大概念模型」，解耦语言表示与推理。网友Chuby兴奋地表示：「如果Meta的大概念模型真的有用，那么同等或更高效率的模型，其规模将更小。比如说1B模型将堪比70B的Llama 4。

1/10训练数据超越GPT-4o！清华等提出隐式过程奖励模型PRIME，在线刷SOTA

告诉我，我会忘记，教我，我会记住，让我参与，我就能学会。 ——本杰明·富兰克林打破数据墙，我们还能做些什么？近日，来自清华UIUC等机构的研究者提出了PRIME（Process Reinforcement through IMplicit REwards）：通过隐式奖励来进行过程强化。

RTX5090震撼发布，国行16499元起，黄仁勋「美国队长」pose亮翻全场

老黄穿上了新皮衣，拿来了新 GPU。今天上午，全世界的目光都集中在了拉斯维加斯。北京时间 1 月 7 日上午 10 点半，英伟达 CEO 黄仁勋在拉斯维加斯 CES 2025 展会上发表了主题演讲（keynote），涉及到的话题包括 GPU、AI、游戏、机器人等等。

手机「自动驾驶」大揭秘！vivo万字综述探讨大模型手机自动化

导言你是否想过，手机能像电影钢铁侠中的智能管家贾维斯那般，一句话就能顺畅自如地完成各种复杂任务。最近国内外的手机厂商和 AI 公司纷纷发布了手机 AI 智能体相关产品，让曾经的幻想逐渐有了可行性。 vivo 作为行业领跑者，在十月的开发者大会上推出了其手机智能体产品 “PhoneGPT"，能帮用户实现一句话点咖啡、订外卖、甚至能够一句话找到最近的私房菜馆并通过 AI 实现电话预定包厢，被网友们称作 “i 人救星”。

单张图像探索3D奇境：Wonderland让高质量3D场景生成更高效

本文的主要作者来自多伦多大学、Snap Inc.和UCLA的研究团队。第一作者为多伦多大学博士生梁汉文和Snap Inc.的曹军力，他们专注于视频生成以及3D/4D场景生成与重建的研究，致力于创造更加真实、高质量的3D和4D场景。团队成员期待与更多志同道合的研究者们交流与合作。