大模型

让Qwen2.5 7B超越o1，微软干的！MSRA推出小模型数学推理自我进化新方法

7B参数的Qwen2.5数学推理表现超过o1-preview，这是怎么做到的？！靠的就是MSRA最新的创新算法，rStar-Math。

1/10/2025 11:42:40 AM

量子位

个人跑大模型，英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好？

前些天，英伟达发布了一大堆东西，其中包括一款 AI 超级计算机 Project DIGITS，机器之心也在第一时间进行了报道，参阅《RTX5090 震撼发布，国行 16499 元起，黄仁勋「美国队长」pose 亮翻全场》。在这篇文章的评论区，一位读者的问题引发了不少争议。虽然该问题的最高赞回复表示这是「英伟达被黑得最惨的一次」，但实际上使用 Mac Mini 作为个人的大模型运行平台并不是什么罕见操作。

1/10/2025 11:39:39 AM

机器之心

Anthropic新研究：用统计思维评估大模型

目前，评估大模型的方法就是比在基准测试中的数值，在于突出SOTA结果，并未充分考虑统计显著性。例如，在对不同模型进行评估时，若仅依据表面的得分高低判断优劣，而不考虑数据的不确定性和变异性，可能会得出不准确的结论。所以，Anthropic提出了将严谨的统计思维引入大模型评估领域。

1/10/2025 10:30:00 AM

AIGC开放社区

真机数据白采了？银河通用具身VLA大模型已充分泛化，预训练基于仿真合成大数据！

近日，英伟达CEO黄仁勋在今年CES的演讲无疑让整个科技圈为之沸腾。他先是向全世界展示了搭载Blackwell新架构的新一代卡皇RTX 5090，然后介绍了英伟达对于人形机器人发展的期盼和投入，并以令人印象深刻的画面结尾——「来自银河通用的全场唯一一台轮式具身大模型机器人Galbot G1将RTX 5090缓缓托起。」发布会结束后，黄仁勋更是第一时间亲自来到银河通用所在的展区，与Galbot机器人进行真机互动。

1/10/2025 9:30:00 AM

新智元

我们一起聊聊如何给AI大模型喂数据？

大家好呀，我是飞鱼。如果我想要大模型学习我的知识，怎么给他数据呢？数据是大模型的食物，只有喂对了，模型才能更好地学习和成长。

1/10/2025 8:06:39 AM

日常加油站

有把握收入从1亿做到数亿！李开复最新回应25年调整：大厂才烧得起超大模型；第一年的打法已不再适用，AI应用爆发前夜公司要提前卡位

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）在零一万物深陷“收购风波”时，李开复第一时间在朋友圈进行了澄清。与此同时，他一口气接受了多个采访，通过披露更多信息来攻破谣言。图片关于零一万物预训练团队和Infra团队的去向已经明晰：愿意继续训练超大参数模型的成员，可以加入零一和阿里云合作成立的“产业大模型联合实验室”。

1/9/2025 1:47:30 PM

伊风

今天起，汉字也能AI视频生成了！《滕王阁序》直接拿捏到位了

“汉字”这个难关，今天终于被AI视频生成给拿下了！话不多说，我们直接先来看效果：这个“福”字，就这样被AI水灵灵地一笔一划滴了出来。再如下面这个例子，我们的Prompt是：有汉字“量子位”，古风。

1/9/2025 1:30:00 PM

量子位

具身智能新高度！智元机器人推出全球首个4D世界模型EnerVerse

如何让机器人在任务指引和实时观测的基础上规划未来动作，一直是具身智能领域的核心科学问题。然而，这一目标的实现受两大关键挑战制约：模态对齐：需在语言、视觉和动作等多模态空间中建立精确的对齐机制。数据稀缺：缺乏规模化、多模态且具备动作标签的数据集。

1/9/2025 12:39:27 PM

机器之心

如何证明一个数是无理数？他们找到了欧拉和黎曼错过的证明，华人数学家唐云清参与

我们都知道，实数分为有理数和无理数，它们的定义也都很明确。但令人惊讶的是，其实很难证明一个数究竟能否写成分数形式。而现在，这个古老的问题有了一种广泛适用的新方法。

1/9/2025 12:24:39 PM

机器之心

讯飞商业生态平台2.0来了！构建大模型应用服务新体系

AI时代的聚光灯已经由“模型参数”转移到“应用价值”，引领千行百业发掘大模型刚需场景，构建新质生产力。据智能超参数发布的《中国大模型中标项目监测报告(2024)》显示，2024年有披露的大模型中标项目达到1520个，相比去年增长了15.5倍。 1月8日，科大讯飞AI服务市场行业伙伴生态大会在北京中关村国际会议中心成功举办。

1/9/2025 12:15:00 PM

新闻助手

OpenAI智能体曝本月诞生！比谷歌Anthropic慢，竟是担心prompt攻击

2025年，智能体将是AI领域最激烈的战场。然而，一直在AI领域「独占鳌头」的OpenAI，却迟迟没有出手。不过，外媒最近曝出了一条好消息——OpenAI可能在本月就会发布自家的「计算机操作智能体」！

1/9/2025 9:00:00 AM

新智元

【LLM&Agent】PPTAgent：PPT自动生成Agent框架

来看一个PPT生成思路：PPTAgent。传统的PPT生成方法通常使用端到端的文本生成范式，这种方法仅关注文本内容，忽略了布局设计和PPT结构。 PPTAgent 采用了一种基于编辑的生成范式，解决处理空间关系和设计风格方面的挑战。

1/8/2025 3:15:16 PM

余俊晖

纯视觉方案，精准操控电脑和手机！港大Aria-UI登顶，超越Claude 3.5

在当今数字时代，智能助手已成为处理跨平台任务的不可或缺工具。然而，如何将用户的自然语言指令精准映射（grounding）到界面元素一直是该领域的核心挑战。传统解决方案主要依赖调用无障碍API、解析HTML源码或提取后台数据，这些方法普遍存在效率低下、信息不完整、兼容性差等显著痛点，严重制约了自动化技术的广泛应用。

1/8/2025 2:43:30 PM

新智元

AAAI 2025 | 大模型推理加速新范式：加速比高达3.51倍、成本降至1/3

近日，中国电信翼支付针对大模型推理加速的最新研究成果《Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregressive Drafting and Custom-Designed Decoding Tree》已被 AAAI 2025 接收。论文中提出的 Falcon 方法是一种增强半自回归投机解码框架，旨在增强 draft model 的并行性和输出质量，以有效提升大模型的推理速度。 Falcon 可以实现约 2.91-3.51 倍的加速比，在多种数据集上获得了很好的结果，并已应用到翼支付多个实际业务中。

1/8/2025 1:15:02 PM

机器之心

黄仁勋圈重点的世界模型平台是个啥？技术报告全解析，华人贡献中坚力量

AI 的下一个前沿是物理。在昨天的 CES 发布会上，英伟达 CEO 黄仁勋通过一个名为「Cosmos」的平台点明了这一主题。简单来说，Cosmos 是一个世界模型平台，上面有一系列开源、开放权重的视频世界模型，参数量从 4B 到 14B 不等。

1/8/2025 1:12:26 PM

机器之心

o1也会「想太多」？腾讯AI Lab与上海交大揭秘o1模型过度思考问题

本文的共同通讯作者为涂兆鹏和王瑞，涂兆鹏为腾讯专家研究员，研究方向为深度学习和大模型，在国际顶级期刊和会议上发表学术论文一百余篇，引用超过9000次。担任SCI期刊NeuroComputing副主编，多次担任ACL、EMNLP、ICLR等国际顶级会议领域主席。王瑞为上海交通大学副教授，研究方向为计算语言学。

1/8/2025 1:08:55 PM

机器之心