文章列表

分类

标签

突破瓶颈！北航ETH等将扩散模型完全量化至1bit，28倍存储节省+52.7倍效率提升

将扩散模型量化到1比特极限，又有新SOTA了！来自北航、ETH等机构的研究人员提出了一种名为BiDM的新方法，首次将扩散模型（DMs）的权重和激活完全二值化。具体而言，作者们从时间和空间的角度对扩散模型进行了优化：从时间角度来看，引入了“时间步友好二值结构”（TBS），通过可学习的激活二值化器和跨时间步特征连接来应对DMs高度时间步相关的激活特征。

1/13/2025 7:00:00 AM

量子位

OpenAI被曝重组机器人团队，4年前缺钱缺数据，如今要做硬件布局了

目标是开发「通用」、「自适应」和「多功能」的机器人。前几天的 CES 大会，黄仁勋在演讲中又双叒叕提到，机器人领域的「ChatGPT 时刻」即将到来，准备迎接机器人的腾飞吧！没错，OpenAI 也是这么想的。

1/12/2025 5:11:00 PM

机器之心

外国工程师开发 ChatGPT 驱动的炮塔可“指哪打哪”，OpenAI 火速封号

OpenAI 在向Futurism提供的声明中表示，公司已经关闭了该开发者的账号。OpenAI方面还表示：“我们主动发现了这一违规行为，并在收到你们的询问之前，已通知开发者停止这项活动。”

1/11/2025 7:59:23 PM

清源

“废片”也值钱：谷歌、OpenAI 被曝购买创作者未发布视频素材，以训练 AI 模型

OpenAI、谷歌、AI 媒体公司 Moonvalley 等正在向数百名内容创作者支付费用，以获取他们未发布的视频素材。由于这些素材没有在网上公开发布，因此它们对训练人工智能算法具有很高的价值，因为它们具有唯一性。

1/11/2025 3:57:52 PM

清源

不停PUA大模型「写更好点」，无需其它花哨技术就能让AI代码水平暴增

AI 的编程能力已经得到了证明，但还并不完美。近日，BuzzFeed 的资深数据科学家 Max Woolf 发现，如果通过提示词不断要求模型写更好的代码（write better code），AI 模型还真能写出更好的代码！这篇文章在网络上引发了热议，著名 AI 科学家在看完这篇文章中更是发出了 matters 三连：迭代很重要，提示词设计很重要，代码执行能力很重要。

1/11/2025 3:37:00 PM

机器之心

ChatGPT两周年：从不被看好到掀起AI浪潮，一文解析缘起与未来

2022年11月30日，当时还只是一个小型初创的OpenAI用一篇博客，以及首席执行官Sam Altman的一条推特，悄然推出了一项名为ChatGPT的新服务。在推文中，奥特曼低调地将其称为「一种可能性的早期demo」，「很大程度上是一项研究的发布」，「仍然有很多限制」。这种措辞看起来与之后的现实情形完全不相符，但从当时来看，OpenAI的团队将期望设定在这个程度是有充足理由的。

1/10/2025 2:30:00 PM

新智元

英伟达迷你超算遭友商嘲讽：宣传FP4算力，实际“不如买个游戏电脑”

老黄在CES上发布的迷你超算Project DIGITS，开启了AI超算的PC时刻。但随即也引发了不小争议，还遭到了大佬的贴脸嘲讽。在AMD和英特尔都工作过的芯片设计专家Raja Koduri实名吐槽道：FLOPs除以4，价格翻倍，这就是在CES上stay grounded的秘诀。

1/10/2025 2:15:47 PM

量子位

AMD把o1炼成了实验室助手，自动科研经费节省84%

芯片强者AMD最新推出科研AI，o1-preview竟成天选打工人？注意看，只需将科研idea和相关笔记一股脑丢给AI，研究报告甚至是代码就能立马出炉了。这个AI系统代号“Agent Laboratory”，全程由LLM（大语言模型）驱动完成文献综述、实验，以及报告，一站式搞定科学研究。

1/10/2025 2:14:44 PM

企业软件是否已告别“太贵”时代？

在不太遥远的未来，GenAI将使企业软件领域以往无法实现或成本过高的功能成为可能。 GenAI，尤其是大型语言模型(LLM)，正在改变公司开发和交付软件的方式。从聊天机器人和简单自动化工具开始的这一进程，正在发展成为功能更为强大的AI系统——这些系统与软件架构深度融合，并影响从后端流程到用户界面的方方面面。

1/10/2025 2:03:38 PM

OpenAI向超级人工智能迈进

OpenAI首席执行官Sam Altman在2025年刚开始就对人工智能的未来发出了大胆的宣言。 Altman表示，OpenAI现在对如何创建AGI（通用人工智能）充满信心，并将重点转移到下一个前沿领域：超级人工智能。 OpenAI的最新模型o3于去年12月发布，目前正在进行安全评估，成功通过了领先的AGI基准ARC-AGI挑战。

1/10/2025 1:36:24 PM

AI情报室

让Qwen2.5 7B超越o1，微软干的！MSRA推出小模型数学推理自我进化新方法

7B参数的Qwen2.5数学推理表现超过o1-preview，这是怎么做到的？！靠的就是MSRA最新的创新算法，rStar-Math。

1/10/2025 11:42:40 AM

量子位

个人跑大模型，英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好？

前些天，英伟达发布了一大堆东西，其中包括一款 AI 超级计算机 Project DIGITS，机器之心也在第一时间进行了报道，参阅《RTX5090 震撼发布，国行 16499 元起，黄仁勋「美国队长」pose 亮翻全场》。在这篇文章的评论区，一位读者的问题引发了不少争议。虽然该问题的最高赞回复表示这是「英伟达被黑得最惨的一次」，但实际上使用 Mac Mini 作为个人的大模型运行平台并不是什么罕见操作。

1/10/2025 11:39:39 AM

机器之心

Anthropic新研究：用统计思维评估大模型

目前，评估大模型的方法就是比在基准测试中的数值，在于突出SOTA结果，并未充分考虑统计显著性。例如，在对不同模型进行评估时，若仅依据表面的得分高低判断优劣，而不考虑数据的不确定性和变异性，可能会得出不准确的结论。所以，Anthropic提出了将严谨的统计思维引入大模型评估领域。

1/10/2025 10:30:00 AM

AIGC开放社区

真机数据白采了？银河通用具身VLA大模型已充分泛化，预训练基于仿真合成大数据！

近日，英伟达CEO黄仁勋在今年CES的演讲无疑让整个科技圈为之沸腾。他先是向全世界展示了搭载Blackwell新架构的新一代卡皇RTX 5090，然后介绍了英伟达对于人形机器人发展的期盼和投入，并以令人印象深刻的画面结尾——「来自银河通用的全场唯一一台轮式具身大模型机器人Galbot G1将RTX 5090缓缓托起。」发布会结束后，黄仁勋更是第一时间亲自来到银河通用所在的展区，与Galbot机器人进行真机互动。

1/10/2025 9:30:00 AM

新智元

我们一起聊聊如何给AI大模型喂数据？

大家好呀，我是飞鱼。如果我想要大模型学习我的知识，怎么给他数据呢？数据是大模型的食物，只有喂对了，模型才能更好地学习和成长。

1/10/2025 8:06:39 AM

日常加油站

有把握收入从1亿做到数亿！李开复最新回应25年调整：大厂才烧得起超大模型；第一年的打法已不再适用，AI应用爆发前夜公司要提前卡位

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）在零一万物深陷“收购风波”时，李开复第一时间在朋友圈进行了澄清。与此同时，他一口气接受了多个采访，通过披露更多信息来攻破谣言。图片关于零一万物预训练团队和Infra团队的去向已经明晰：愿意继续训练超大参数模型的成员，可以加入零一和阿里云合作成立的“产业大模型联合实验室”。

1/9/2025 1:47:30 PM

伊风

今天起，汉字也能AI视频生成了！《滕王阁序》直接拿捏到位了

“汉字”这个难关，今天终于被AI视频生成给拿下了！话不多说，我们直接先来看效果：这个“福”字，就这样被AI水灵灵地一笔一划滴了出来。再如下面这个例子，我们的Prompt是：有汉字“量子位”，古风。

1/9/2025 1:30:00 PM

量子位

具身智能新高度！智元机器人推出全球首个4D世界模型EnerVerse

如何让机器人在任务指引和实时观测的基础上规划未来动作，一直是具身智能领域的核心科学问题。然而，这一目标的实现受两大关键挑战制约：模态对齐：需在语言、视觉和动作等多模态空间中建立精确的对齐机制。数据稀缺：缺乏规模化、多模态且具备动作标签的数据集。

1/9/2025 12:39:27 PM

机器之心

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体 OpenAI发布GPT-4.1指令提示工程指南 Midjourney图像编辑器迎来重大更新：全新UI、图层功能与智能工具上线

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测人形机器人伟达 Transformer 百度深度学习 AI视频苹果模态 xAI 字节跳动驾驶文本搜索大语言模型具身智能 Claude Copilot 神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊大型语言模型干货合集特斯拉 2024 AGI 训练