AIGC宇宙 AIGC宇宙

大模型

让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法

7B参数的Qwen2.5数学推理表现超过o1-preview,这是怎么做到的? ! 靠的就是MSRA最新的创新算法,rStar-Math。
1/10/2025 11:42:40 AM
量子位

个人跑大模型,英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好?

前些天,英伟达发布了一大堆东西,其中包括一款 AI 超级计算机 Project DIGITS,机器之心也在第一时间进行了报道,参阅《RTX5090 震撼发布,国行 16499 元起,黄仁勋「美国队长」pose 亮翻全场》。 在这篇文章的评论区,一位读者的问题引发了不少争议。 虽然该问题的最高赞回复表示这是「英伟达被黑得最惨的一次」,但实际上使用 Mac Mini 作为个人的大模型运行平台并不是什么罕见操作。
1/10/2025 11:39:39 AM
机器之心

Anthropic新研究:用统计思维评估大模型

目前,评估大模型的方法就是比在基准测试中的数值,在于突出SOTA结果,并未充分考虑统计显著性。 例如,在对不同模型进行评估时,若仅依据表面的得分高低判断优劣,而不考虑数据的不确定性和变异性,可能会得出不准确的结论。 所以,Anthropic提出了将严谨的统计思维引入大模型评估领域。
1/10/2025 10:30:00 AM
AIGC开放社区

真机数据白采了?银河通用具身VLA大模型已充分泛化,预训练基于仿真合成大数据!

近日,英伟达CEO黄仁勋在今年CES的演讲无疑让整个科技圈为之沸腾。 他先是向全世界展示了搭载Blackwell新架构的新一代卡皇RTX 5090,然后介绍了英伟达对于人形机器人发展的期盼和投入,并以令人印象深刻的画面结尾——「来自银河通用的全场唯一一台轮式具身大模型机器人Galbot G1将RTX 5090缓缓托起。 」发布会结束后,黄仁勋更是第一时间亲自来到银河通用所在的展区,与Galbot机器人进行真机互动。
1/10/2025 9:30:00 AM
新智元

我们一起聊聊如何给AI大模型喂数据?

大家好呀,我是飞鱼。 如果我想要大模型学习我的知识,怎么给他数据呢? 数据是大模型的食物,只有喂对了,模型才能更好地学习和成长。
1/10/2025 8:06:39 AM
日常加油站

有把握收入从1亿做到数亿!李开复最新回应25年调整:大厂才烧得起超大模型;第一年的打法已不再适用,AI应用爆发前夜公司要提前卡位

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)在零一万物深陷“收购风波”时,李开复第一时间在朋友圈进行了澄清。 与此同时,他一口气接受了多个采访,通过披露更多信息来攻破谣言。 图片关于零一万物预训练团队和Infra团队的去向已经明晰:愿意继续训练超大参数模型的成员,可以加入零一和阿里云合作成立的“产业大模型联合实验室”。
1/9/2025 1:47:30 PM
伊风

今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了

“汉字”这个难关,今天终于被AI视频生成给拿下了! 话不多说,我们直接先来看效果:这个“福”字,就这样被AI水灵灵地一笔一划滴了出来。 再如下面这个例子,我们的Prompt是:有汉字“量子位”,古风。
1/9/2025 1:30:00 PM
量子位

具身智能新高度!智元机器人推出全球首个4D世界模型EnerVerse

如何让机器人在任务指引和实时观测的基础上规划未来动作,一直是具身智能领域的核心科学问题。 然而,这一目标的实现受两大关键挑战制约:模态对齐:需在语言、视觉和动作等多模态空间中建立精确的对齐机制。 数据稀缺:缺乏规模化、多模态且具备动作标签的数据集。
1/9/2025 12:39:27 PM
机器之心

如何证明一个数是无理数?他们找到了欧拉和黎曼错过的证明,华人数学家唐云清参与

我们都知道,实数分为有理数和无理数,它们的定义也都很明确。 但令人惊讶的是,其实很难证明一个数究竟能否写成分数形式。 而现在,这个古老的问题有了一种广泛适用的新方法。
1/9/2025 12:24:39 PM
机器之心

讯飞商业生态平台2.0来了!构建大模型应用服务新体系

AI时代的聚光灯已经由“模型参数”转移到“应用价值”,引领千行百业发掘大模型刚需场景,构建新质生产力。 据智能超参数发布的《中国大模型中标项目监测报告(2024)》显示,2024年有披露的大模型中标项目达到1520个,相比去年增长了15.5倍。 1月8日,科大讯飞AI服务市场行业伙伴生态大会在北京中关村国际会议中心成功举办。
1/9/2025 12:15:00 PM
新闻助手

OpenAI智能体曝本月诞生!比谷歌Anthropic慢,竟是担心prompt攻击

2025年,智能体将是AI领域最激烈的战场。 然而,一直在AI领域「独占鳌头」的OpenAI,却迟迟没有出手。 不过,外媒最近曝出了一条好消息——OpenAI可能在本月就会发布自家的「计算机操作智能体」!
1/9/2025 9:00:00 AM
新智元

【LLM&Agent】PPTAgent:PPT自动生成Agent框架

来看一个PPT生成思路:PPTAgent。 传统的PPT生成方法通常使用端到端的文本生成范式,这种方法仅关注文本内容,忽略了布局设计和PPT结构。 PPTAgent 采用了一种基于编辑的生成范式,解决处理空间关系和设计风格方面的挑战。
1/8/2025 3:15:16 PM
余俊晖

纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

在当今数字时代,智能助手已成为处理跨平台任务的不可或缺工具。 然而,如何将用户的自然语言指令精准映射(grounding)到界面元素一直是该领域的核心挑战。 传统解决方案主要依赖调用无障碍API、解析HTML源码或提取后台数据,这些方法普遍存在效率低下、信息不完整、兼容性差等显著痛点,严重制约了自动化技术的广泛应用。
1/8/2025 2:43:30 PM
新智元

AAAI 2025 | 大模型推理加速新范式:加速比高达3.51倍、成本降至1/3

近日,中国电信翼支付针对大模型推理加速的最新研究成果《Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregressive Drafting and Custom-Designed Decoding Tree》已被 AAAI 2025 接收。 论文中提出的 Falcon 方法是一种增强半自回归投机解码框架,旨在增强 draft model 的并行性和输出质量,以有效提升大模型的推理速度。 Falcon 可以实现约 2.91-3.51 倍的加速比,在多种数据集上获得了很好的结果,并已应用到翼支付多个实际业务中。
1/8/2025 1:15:02 PM
机器之心

黄仁勋圈重点的世界模型平台是个啥?技术报告全解析,华人贡献中坚力量

AI 的下一个前沿是物理。 在昨天的 CES 发布会上,英伟达 CEO 黄仁勋通过一个名为「Cosmos」的平台点明了这一主题。 简单来说,Cosmos 是一个世界模型平台,上面有一系列开源、开放权重的视频世界模型,参数量从 4B 到 14B 不等。
1/8/2025 1:12:26 PM
机器之心

o1也会「想太多」?腾讯AI Lab与上海交大揭秘o1模型过度思考问题

本文的共同通讯作者为涂兆鹏和王瑞,涂兆鹏为腾讯专家研究员,研究方向为深度学习和大模型,在国际顶级期刊和会议上发表学术论文一百余篇,引用超过9000次。 担任SCI期刊NeuroComputing副主编,多次担任ACL、EMNLP、ICLR等国际顶级会议领域主席。 王瑞为上海交通大学副教授,研究方向为计算语言学。
1/8/2025 1:08:55 PM
机器之心

奥特曼家里也内讧了!亲妹告他长期虐待,刻意隐瞒遗产;家里其他人联名否认

我去,OpenAI CEO奥特曼的亲妹妹,一纸状书,把她亲哥给告了! 想不到让奥特曼再次陷入舆论危机的矛头,这次居然来自家庭内部,来自小他9岁的妹妹安妮·奥特曼(Annie Altman)。 事态紧急,奥特曼立刻联名母亲和两位弟弟,共同发布回应:不,指控不实。
1/8/2025 11:57:28 AM
量子位

金山云全面升级智算服务体系开启AI 2.0时代云计算发展新纪元​

随着大模型落地应用,人工智能发展进入2.0时代。 在此阶段,智算云服务加速演进,成为新一代人工智能发展的核心驱动力,展现出无限潜能。 知名调研机构IDC发布的《中国智算服务市场(2024上半年)跟踪》报告显示,2024年上半年中国智算服务整体市场同比增长79.6%,市场规模达到146.1亿元人民币。
1/8/2025 11:38:53 AM