chatgpt

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来，它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练，它就能直接拿下数学奥赛金牌，甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo，我们看了不少，评估 o1 表现的评测，全网比比皆是，关于 o1 技术路线的讨论也如火如荼，引发了广泛的关注和深入的思考。不过 o1 背后的故事，还鲜为人知，那些在幕后默默付出的团队成员们，他们的故事同样值得被讲述和铭记。刚刚，OpenAI 发布了 o1 研发团队的完整访谈，为我们揭秘了 o1 的「成长历程」。o

9/22/2024 1:27:00 PM

机器之心

部分科技巨头请求欧盟对 AI“从宽”监管，避免数十亿美元罚款风险

据路透社 20 日报道，一些全球科技巨头正在尽最后的努力，试图说服欧盟在监管 AI 时采取宽松的方式，以避免面临数十亿美元的罚款风险。在经过各政治团体几个月的激烈谈判后，欧盟今年 5 月通过了《人工智能法》（AI Act），这是全球首个全面规范该技术的法律。然而在相关操作规程最终敲定之前，仍然不清楚如何严格执行针对通用用途人工智能（GPAI）系统（如 OpenAI 的 ChatGPT）的规定，以及公司可能面临多少版权诉讼和数十亿美元的罚款。欧盟已邀请公司、学者及其他相关方帮助起草操作规程，据不具名知情人士透露，欧盟

9/21/2024 8:16:40 PM

清源

OpenAI 朝 AI 第 3 阶段迈进，正招募人才组建“多智能体”团队

OpenAI 在发布 o1 AI 模型之后，下一步会怎么走？该公司研究员诺姆・布朗（Noam Brown）在 X 平台给出了答案，组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表，最新推出的 o1 模型处于第二阶段，即所谓的“推理者”（reasoners），而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下：第一级：聊天机器人，具有会话语言的人工智能第二级：推理者，解决人类水平问题的人工智能第三级：智能体，能够代表用户采取行动的人工智能第四级：创新

9/21/2024 12:10:50 PM

故渊

OpenAI 笑傲 AI 江湖：新 50-70 亿美元融资将完成，估值有望破 1500 亿美元

科技媒体 The Decoder 昨日（9 月 20 日）发布博文，报道称 OpenAI 公司即将完成一轮价值 50 亿至 70 亿美元（当前约 352.76 亿至 493.86 亿元人民币）的大规模融资，公司估值有望达到 1500 亿美元（当前约 1.06 万亿元人民币）。消息称在本次融资中，OpenAI 设定的最低投资额为 2.5 亿美元（当前约 17.64 亿元人民币）。本次融资由 Thrive Capital 领投，承诺投资 10 亿美元（当前约 70.55 亿元人民币），AI在线附上其他参投的企业如下：微

9/21/2024 11:26:55 AM

故渊

o1带火的CoT到底行不行？新论文引发了论战

To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也‍提到 o1 在某些任务上的表现并不比 GPT-4o 强，尤其是以语言为中心的任务。近日，一篇来自德克萨斯大学奥斯汀分校、约翰·霍普金斯大学和普林斯顿大学的论文引发了热议，其模仿莎士比亚《哈姆雷特》的台词提出了一个对 AI 研究者和实践者来说至关重要的问题：To CoT or not to

9/20/2024 1:35:00 PM

机器之心

别Cursor了，集成o1的GitHub Copilot让网友直呼要回归

waitlist 挤爆了。草莓大模型又来了。昨天，GitHub CEO Thomas Dohmke 预告了一则关于草莓模型的推文，一时间勾起了很多人的好奇心。很多人猜测 GitHub Copilot 要集成 OpenAI 最新的 o1 系列模型了，毕竟再不升级就可能要被最近势头很猛的 Cursor 抢走更多用户了。果不其然，今天一大早，GitHub 便官宣了在 VSCode 中为 GitHub Copilot Chat 开放 o1-preview 和 o1-mini 的早期访问权。同时，用户也可以在 Github

9/20/2024 1:31:00 PM

机器之心

OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜：数学能力碾压 Claude 和谷歌 Gemini 模型，o1-mini 并列第一

o1 模型发布 1 周，lmsys 的 6k 投票就将 o1-preview 送上了排行榜榜首。同时，为了满足大家对模型「IOI 金牌水平」的好奇心，OpenAI 放出了 o1 测评时提交的所有代码。万众瞩目的最新模型 OpenAI o1，终于迎来了 lmsys 竞技场的测评结果。不出意外，o1-preview 在各种领域绝对登顶，超过了最新版的 GPT-4o，在数学、困难提示和编码领域表现出色；而 o1-mini 虽然名字中自带「mini」，但也和最新版的 GPT-4o 并列综合排名第二，困难提示、编码、数学

9/20/2024 1:29:05 PM

问舟

OpenAI 再成“榜一大哥”：o1-preview AI 模型更轻松驾驭数学、编程等任务

科技媒体 The Decoder 昨日（9 月 19 日）发布博文，报道称在聊天机器人竞技场（Chatbot Arena）上，OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台，它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。结果结果显示，o1-preview 和 o1-mini 尤其在数学任务、复杂提示和编程方面表现出色。Lmsys 提供的数学模型优势图表清楚地显示，o1-preview 和 o1

9/20/2024 10:29:14 AM

故渊

研究称生成式 AI 耗水量巨大：使用 GPT-4 生成 100 字文本需消耗 3 瓶水

据《华盛顿邮报》报道，美国加州大学河滨分校的一项新研究揭示了生成式 AI 的惊人环境成本，尤其是其对水资源的消耗。研究发现，即使只是生成文本，AI 也需要大量的水来冷却服务器。再加上其对电网的巨大压力，进一步凸显了 AI 发展的环境挑战。图源 Pexels研究指出，AI 的用水量因州和数据中心位置的不同而有所差异，但总体而言，水耗与电费成反比。AI在线注意到，得州的水耗最低，生成一封 100 字的电子邮件仅需 235 毫升水，而华盛顿则高达 1,408 毫升，相当于三瓶 16.9 盎司的矿泉水。此外，数据中心本身就

9/19/2024 9:00:16 PM

远洋

阿尔特曼称 o1 仅仅是“推理模型的 GPT-2”，黄仁勋表示“给你加速 50 倍”

AI 界最有影响力的两个人，同时出现在一场活动：OpenAI CEO 阿尔特曼，暗示了 o1 满血版将在接下来几个月发布。英伟达创始人黄仁勋，则表示新一代 Blackwell 架构 GPU 能给 o1 推理提速 50 倍。阿尔特曼把 o1 在推理模型里的地位比作语言模型中的 GPT-2 阶段。几年后人们将看到“推理模型的 GPT-4”，不过最近几个月就会有重大改进，新范式的进步曲线非常陡峭。L2“推理者”与 L1“聊天机器人”非常不同，大家还没找到该怎么用这些模型，我们也没决定该为 App 继续添加什么功能。不过最

9/19/2024 4:41:34 PM

清源

新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式

科技媒体 testingcatalog 昨日（9 月 18 日）发布博文，报道称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式，甚至可能是直接正式发布。OpenAI 于今年 7 月宣布向一小部分 ChatGPT Plus 用户开放 ChatGPT 的高级语音模式，让用户首次获得 GPT-4o 的超现实音频响应。AI在线援引该媒体报道，OpenAI 公司已更新高级语音模式 FAQ 页面，在代码中被发现“hasSeenAdvancedVoice/2024-09-24”的字符串，

9/19/2024 9:08:32 AM

故渊

实测 | GPT-o1：学会了思考，也学会了偷懒

我可能是全网第一个花钱向 GPT-o1 提问，人在深圳靠一条网线横跨太平洋到美国硅谷让 OpenAI 最强大模型 GPT-o1 模型思考 38 秒之后、宕机了半小时选择拒绝回答问题并收了我2.5块（一瓶肥宅快乐水）的韭菜...... （因为这个模型只支持订阅使用并且一个月只回复120条内容，plus会员订阅费1个月20美刀，约等于1.25软妹币1条回答......）OpenAI 今天凌晨突击更新 GPT-o1，早上起来全网都在开香槟，大意就是突破了LLM极限，新模型能力在生物、物理比肩甚至超越人类博士生。另一个特性就是 o1 模型会用更长的时间思考以此来尽可能完善的回答问题。

9/18/2024 3:26:00 PM

林杰鑫

陶哲轩提前实测满血版 OpenAI o1：能当研究生使唤

原来早在 8 月份，陶哲轩就已经用上了 OpenAI o1。还是现在大家都用不上的满血版本（眼泪不争气地从嘴角流出来）。提前批大佬是怎么玩最新天花板的呢？他向 o1 模型提出一个措辞模糊的数学问题，发现它竟然能成功识别出克莱姆定理。而且答案是“完全令人满意的”那种。当然，陶哲轩还做了一些其它测试，测下来总体体验就是：比以前的模型更牛，多堆点提示词表现还不错，但仍然会犯不小的错误，也没有产生啥自己的思想。陶哲轩是这样形容的：这种感觉，就像给一个平庸无奇但又有点小能力的研究生提供建议。不过，这已经比以前的模型有所改进，

9/16/2024 6:51:12 PM

清源

消息称 OpenAI 明年调整结构，转变为传统的营利性公司

《财富》（fortune）于 9 月 13 日发布博文，报道称山姆・阿尔特曼（Sam Altman）在最近周会上，向 OpenAI 公司员工宣布，将于明年调整颇为复杂的非营利性企业结构。报道称 OpenAI 在保留一个非营利部门之外，调整成为更传统的营利性公司。阿尔特曼表示 OpenAI 将摆脱非营利实体控制，转型为一家更为传统的营利性组织，但在周会上并未透露更多细节。AI在线援引消息源报道，OpenAI 一位发言人透露公司仍“致力于构建造福所有人的 AI”，并强调非营利性是“其使命的核心，并将持续存在”。Open

9/15/2024 1:54:12 PM

故渊

OpenAI o1 非 GPT-4o 直接进化，在成本与性能上妥协

9 月 14 日消息，OpenAI 已经推出了新模型 OpenAI o1 的两大变体 ——o1-preview 与 o1-mini，这两款模型都有许多值得深入探讨的内容。人工智能专家西蒙・威利森（Simon Willison）专门发文，深入剖析了这些新模型背后的设计理念与实现细节，揭示了它们在技术上的独特优势与不足。威利森表示，o1 并不是简单的 GPT-4o 直接升级版，而是在强化“推理”能力的同时，做出了成本与性能上的权衡。1. 训练思维链OpenAI 的声明是一个很好的起点：“我们研发了一系列新型人工智能模型

9/14/2024 10:40:51 PM

小小

o1 模型完整思维链成 OpenAI 头号禁忌，问多了等着封号吧

警告！不要在 ChatGPT 里问最新 o1 模型是怎么思考的 ——只要尝试几次，OpenAI 就会发邮件威胁撤销你的使用资格。请停止此活动，确保您使用 ChatGPT 时符合我们的使用条款。违反此条款的行为可能导致失去 OpenAI o1 访问权限。大模型新范式 o1 横空出世不到 24 小时，就已经有不少用户反馈收到这封警告邮件，引起众人不满。有人反馈只要提示词里带“reasoning trace”、“show your chain of thought”等关键词就会收到警告。甚至完全避免出现关键词，使用其他手

9/14/2024 12:50:33 PM

汪淼

因类人通用推理、可辅助制作生物武器等因素，OpenAI o1 AI 模型归类为“中等风险”

科技媒体 The Decoder 昨日（9 月 13 日）发布博文，报道称在 OpenAI 自家的“防备框架”（Preparedness Framework）下，将最新发布的 o1 AI 模型归类为“中等风险”（medium risk）。防备框架简介AI在线曾于 2023 年 12 月报道，OpenAI 成立了新的“防备”（Preparedness）团队，并提出“防备框架”指导方针。防备团队将反复评估 OpenAI 最先进、尚未发布的 AI 模型，根据不同类型的感知风险评为四个等级，从低到高依次是“低”、“中”、“

9/14/2024 9:29:08 AM

故渊

OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令

OpenAI 扩充 ChatGPT 系统快捷指令，新增“/picture”和“/search”，进一步改善用户的交互体验。AI在线附上操作方法如下：在与 ChatGPT 对话时，只需输入一个“/”（不含双引号），一个便捷的弹出窗口就会显示这些快捷选项。“/picture”该指令会调用 OpenAI 的文生图模型 DALL-E，即使用户没有具体的提示或想法，只需选择 / picture，也能为你生成有趣的图像。“/search”该指令会进入一个新的搜索模式，你输入的任何内容都会被视为搜索查询。即便用户没有输入任何内容

9/14/2024 9:13:18 AM

故渊

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写 AI视频用哪个？6个知名的AI视频工具使用测评报告韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练