「草莓」即将上线,OpenAI新旗舰大模型曝光,代号「猎户座」

ChatGPT 要进化了?本月初,OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片,勾起了大家强烈的好奇心。「四个红草莓,其中还有一个未成熟的青色草莓,这不妥妥地是在说下一代 AI 大模型 GPT-5 要来了吗?」奥特曼在回应网友时也在暗示,惊喜马上就来。据科技媒体 The Information 报道,传说中的「草莓」真的要来了!两位参与该项目的人士表示,OpenAI 计划最早在今年秋天推出代号为 「草莓」(之前称为 Q*,发音为 Q Star)的新人工智能,作为聊天机器人的一部分(可能集成在

ChatGPT 要进化了?

本月初,OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片,勾起了大家强烈的好奇心。

图片

「四个红草莓,其中还有一个未成熟的青色草莓,这不妥妥地是在说下一代 AI 大模型 GPT-5 要来了吗?」奥特曼在回应网友时也在暗示,惊喜马上就来。

图片

据科技媒体 The Information 报道,传说中的「草莓」真的要来了!

两位参与该项目的人士表示,OpenAI 计划最早在今年秋天推出代号为 「草莓」(之前称为 Q*,发音为 Q Star)的新人工智能,作为聊天机器人的一部分(可能集成在 ChatGPT 内)。「草莓」 可以解决它以前从未见过的数学问题(这是当今的聊天机器人无法准确做到的),并且训练后还可以解决涉及编程的问题,但它并不局限于回答技术问题。

据 The Information 报道,OpenAI 正在开发新旗舰 LLM,代号「Orion」。该模型旨在改进去年年初推出的现有旗舰 LLM——GPT-4。

而「草莓」旨在改进即将推出的「Orion(猎户座)」,并且 OpenAI 已经向安全监管人员展示了「草莓」模型。较小版本的「草莓」可以以聊天机器人的形式推出。

知情人士表示:OpenAI 正在使用较大版本的「草莓」来生成用于训练 Orion 的数据。这种人工智能生成的数据被称为「合成数据」。这意味着「草莓」可以帮助 OpenAI 克服获取足够高质量数据的限制,以便利用现实世界的数据(例如从互联网上提取的文本或图像)训练新模型。

当给予额外的「思考」时间时,「草莓」可以回答用户更主观的问题,例如产品营销策略。

OpenAI 推出「草莓」是为了保持对话式人工智能或大型语言模型的霸主地位。该技术还将对未来完成多步骤任务的智能体产品产生影响。 OpenAI 希望在智能体领域开辟更多收入机会。

为什么「草莓」对「Orion」如此重要

「草莓」最重要的应用之一是为下一代旗舰大语言模型 Orion 生成高质量的训练数据。该代号此前从未被报道过。

简单来说,「草莓」 可以生成更高质量的训练数据。智能体初创公司 Minion AI 的首席执行官、GitHub Copilot 的前首席架构师 Alex Graveley 表示,使用「草莓」生成更高质量的训练数据可以帮助 OpenAI 减少其模型生成的错误(也称为幻觉)数量,他还指出之所以能够做到这一点,是因为「训练数据中的歧义性较少」。

这里不得不提一下,OpenAI CEO 山姆・奥特曼在五月份的一次活动中曾说道:「我们觉得我们已经为下一个模型提供了足够的(数据),我们做了各种各样的实验,包括生成合成数据。」下一个模型可能指的就是「Orion」。

OpenAI 内部也在推动通过一种称为蒸馏(distillation)的过程来简化和缩小「草莓」。

现在还不能确定基于「草莓」的最终的产品将会是什么样子,但一个显而易见的想法是将「草莓」的推理能力融入到 ChatGPT。其结果是答案可能会更准确,但可能会更慢。

这意味着「草莓」可能不太适合用户期望立即得到响应的需求,但非常适合对时间不太敏感的用例。

或许我们可以想象,在不久的将来,ChatGPT 用户可以根据自身对时间的敏感程度来打开或关闭「草莓」。

今年夏天,OpenAI 已经向安全监管人员展示了「草莓」模型。此次演示可能是 OpenAI 努力向政策制定者提高透明度的一部分。

鉴于今年早些时候,Ilya Sutskever 等几位安全负责人的离职,对 OpenAI 来说,技术透明将尤其重要。

参考链接:

https://www.theinformation.com/articles/openai-races-to-launch-strawberry-reasoning-ai-to-boost-chatbot-business?rc=ks2jbm

https://www.theinformation.com/articles/openai-shows-strawberry-ai-to-the-feds-and-uses-it-to-develop-orion?rc=ks2jbm

相关资讯

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo,我们看了不少,评估 o1 表现的评测,全网比比皆是,关于 o1 技术路线的讨论也如火如荼,引发了广泛的关注和深入的思考。不过 o1 背后的故事,还鲜为人知,那些在幕后默默付出的团队成员们,他们的故事同样值得被讲述和铭记。刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o

LeCun批评o1根本不像研究,Noam Brown回怼:已发表的研究都是废话

图灵奖三巨头之一 Yann LeCun 又和别人吵起来了,这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一,此前他是 Meta FAIR 的一员,主导了曾火遍一时的 CICERO 项目,在 2023 年 6 月加入 OpenAI  。这次吵架的内容就是围绕 o1 展开的。众所周知,从 AI 步入新的阶段以来,OpenAI 一直选择了闭源,o1 的发布也不例外。这也引来了广大网友的吐槽,干脆叫 CloseAI 算了,反观 Meta,在开源领域就做的很好,o1 的发布,更

OpenAI o1 推理模型 API 上线,仅面向特定开发者开放

“OpenAI 12 天”活动进入第 9 天,OpenAI 今日宣布,其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放,并同步更新了包括 GPT-4o、实时 API 以及微调 API 等多项开发者工具。