文章列表
突破瓶颈!北航ETH等将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升
将扩散模型量化到1比特极限,又有新SOTA了! 来自北航、ETH等机构的研究人员提出了一种名为BiDM的新方法,首次将扩散模型(DMs)的权重和激活完全二值化。 具体而言,作者们从时间和空间的角度对扩散模型进行了优化:从时间角度来看,引入了“时间步友好二值结构”(TBS),通过可学习的激活二值化器和跨时间步特征连接来应对DMs高度时间步相关的激活特征。
1/13/2025 7:00:00 AM
量子位
OpenAI被曝重组机器人团队,4年前缺钱缺数据,如今要做硬件布局了
目标是开发「通用」、「自适应」和「多功能」的机器人。 前几天的 CES 大会,黄仁勋在演讲中又双叒叕提到,机器人领域的「ChatGPT 时刻」即将到来,准备迎接机器人的腾飞吧! 没错,OpenAI 也是这么想的。
1/12/2025 5:11:00 PM
机器之心
外国工程师开发 ChatGPT 驱动的炮塔可“指哪打哪”,OpenAI 火速封号
OpenAI 在向Futurism提供的声明中表示,公司已经关闭了该开发者的账号。OpenAI方面还表示:“我们主动发现了这一违规行为,并在收到你们的询问之前,已通知开发者停止这项活动。”
1/11/2025 7:59:23 PM
清源
“废片”也值钱:谷歌、OpenAI 被曝购买创作者未发布视频素材,以训练 AI 模型
OpenAI、谷歌、AI 媒体公司 Moonvalley 等正在向数百名内容创作者支付费用,以获取他们未发布的视频素材。由于这些素材没有在网上公开发布,因此它们对训练人工智能算法具有很高的价值,因为它们具有唯一性。
1/11/2025 3:57:52 PM
清源
不停PUA大模型「写更好点」,无需其它花哨技术就能让AI代码水平暴增
AI 的编程能力已经得到了证明,但还并不完美。 近日,BuzzFeed 的资深数据科学家 Max Woolf 发现,如果通过提示词不断要求模型写更好的代码(write better code),AI 模型还真能写出更好的代码! 这篇文章在网络上引发了热议,著名 AI 科学家在看完这篇文章中更是发出了 matters 三连:迭代很重要,提示词设计很重要,代码执行能力很重要。
1/11/2025 3:37:00 PM
机器之心
ChatGPT两周年:从不被看好到掀起AI浪潮,一文解析缘起与未来
2022年11月30日,当时还只是一个小型初创的OpenAI用一篇博客,以及首席执行官Sam Altman的一条推特,悄然推出了一项名为ChatGPT的新服务。 在推文中,奥特曼低调地将其称为「一种可能性的早期demo」,「很大程度上是一项研究的发布」,「仍然有很多限制」。 这种措辞看起来与之后的现实情形完全不相符,但从当时来看,OpenAI的团队将期望设定在这个程度是有充足理由的。
1/10/2025 2:30:00 PM
新智元
英伟达迷你超算遭友商嘲讽:宣传FP4算力,实际“不如买个游戏电脑”
老黄在CES上发布的迷你超算Project DIGITS,开启了AI超算的PC时刻。 但随即也引发了不小争议,还遭到了大佬的贴脸嘲讽。 在AMD和英特尔都工作过的芯片设计专家Raja Koduri实名吐槽道:FLOPs除以4,价格翻倍,这就是在CES上stay grounded的秘诀。
1/10/2025 2:15:47 PM
量子位
AMD把o1炼成了实验室助手,自动科研经费节省84%
芯片强者AMD最新推出科研AI,o1-preview竟成天选打工人? 注意看,只需将科研idea和相关笔记一股脑丢给AI,研究报告甚至是代码就能立马出炉了。 这个AI系统代号“Agent Laboratory”,全程由LLM(大语言模型)驱动完成文献综述、实验,以及报告,一站式搞定科学研究。
1/10/2025 2:14:44 PM
企业软件是否已告别“太贵”时代?
在不太遥远的未来,GenAI将使企业软件领域以往无法实现或成本过高的功能成为可能。 GenAI,尤其是大型语言模型(LLM),正在改变公司开发和交付软件的方式。 从聊天机器人和简单自动化工具开始的这一进程,正在发展成为功能更为强大的AI系统——这些系统与软件架构深度融合,并影响从后端流程到用户界面的方方面面。
1/10/2025 2:03:38 PM
OpenAI向超级人工智能迈进
OpenAI首席执行官Sam Altman在2025年刚开始就对人工智能的未来发出了大胆的宣言。 Altman表示,OpenAI现在对如何创建AGI(通用人工智能)充满信心,并将重点转移到下一个前沿领域:超级人工智能。 OpenAI的最新模型o3于去年12月发布,目前正在进行安全评估,成功通过了领先的AGI基准ARC-AGI挑战。
1/10/2025 1:36:24 PM
AI情报室
让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法
7B参数的Qwen2.5数学推理表现超过o1-preview,这是怎么做到的? ! 靠的就是MSRA最新的创新算法,rStar-Math。
1/10/2025 11:42:40 AM
量子位
个人跑大模型,英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好?
前些天,英伟达发布了一大堆东西,其中包括一款 AI 超级计算机 Project DIGITS,机器之心也在第一时间进行了报道,参阅《RTX5090 震撼发布,国行 16499 元起,黄仁勋「美国队长」pose 亮翻全场》。 在这篇文章的评论区,一位读者的问题引发了不少争议。 虽然该问题的最高赞回复表示这是「英伟达被黑得最惨的一次」,但实际上使用 Mac Mini 作为个人的大模型运行平台并不是什么罕见操作。
1/10/2025 11:39:39 AM
机器之心
Anthropic新研究:用统计思维评估大模型
目前,评估大模型的方法就是比在基准测试中的数值,在于突出SOTA结果,并未充分考虑统计显著性。 例如,在对不同模型进行评估时,若仅依据表面的得分高低判断优劣,而不考虑数据的不确定性和变异性,可能会得出不准确的结论。 所以,Anthropic提出了将严谨的统计思维引入大模型评估领域。
1/10/2025 10:30:00 AM
AIGC开放社区
真机数据白采了?银河通用具身VLA大模型已充分泛化,预训练基于仿真合成大数据!
近日,英伟达CEO黄仁勋在今年CES的演讲无疑让整个科技圈为之沸腾。 他先是向全世界展示了搭载Blackwell新架构的新一代卡皇RTX 5090,然后介绍了英伟达对于人形机器人发展的期盼和投入,并以令人印象深刻的画面结尾——「来自银河通用的全场唯一一台轮式具身大模型机器人Galbot G1将RTX 5090缓缓托起。 」发布会结束后,黄仁勋更是第一时间亲自来到银河通用所在的展区,与Galbot机器人进行真机互动。
1/10/2025 9:30:00 AM
新智元
我们一起聊聊如何给AI大模型喂数据?
大家好呀,我是飞鱼。 如果我想要大模型学习我的知识,怎么给他数据呢? 数据是大模型的食物,只有喂对了,模型才能更好地学习和成长。
1/10/2025 8:06:39 AM
日常加油站
有把握收入从1亿做到数亿!李开复最新回应25年调整:大厂才烧得起超大模型;第一年的打法已不再适用,AI应用爆发前夜公司要提前卡位
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)在零一万物深陷“收购风波”时,李开复第一时间在朋友圈进行了澄清。 与此同时,他一口气接受了多个采访,通过披露更多信息来攻破谣言。 图片关于零一万物预训练团队和Infra团队的去向已经明晰:愿意继续训练超大参数模型的成员,可以加入零一和阿里云合作成立的“产业大模型联合实验室”。
1/9/2025 1:47:30 PM
伊风
今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了
“汉字”这个难关,今天终于被AI视频生成给拿下了! 话不多说,我们直接先来看效果:这个“福”字,就这样被AI水灵灵地一笔一划滴了出来。 再如下面这个例子,我们的Prompt是:有汉字“量子位”,古风。
1/9/2025 1:30:00 PM
量子位
具身智能新高度!智元机器人推出全球首个4D世界模型EnerVerse
如何让机器人在任务指引和实时观测的基础上规划未来动作,一直是具身智能领域的核心科学问题。 然而,这一目标的实现受两大关键挑战制约:模态对齐:需在语言、视觉和动作等多模态空间中建立精确的对齐机制。 数据稀缺:缺乏规模化、多模态且具备动作标签的数据集。
1/9/2025 12:39:27 PM
机器之心