应对DeepSeek挑战,OpenAI增加o3-mini公开推理过程

OpenAI近日宣布展示其最新推理模型o3-mini的详细推理过程,此举被视为对竞争对手DeepSeek-R1日益增长压力的回应。 这一改变标志着OpenAI在模型透明度策略上的重要转变。 此前,OpenAI一直将"思维链"(Chain of Thought, CoT)视为核心竞争优势而选择隐藏。

OpenAI近日宣布展示其最新推理模型o3-mini的详细推理过程,此举被视为对竞争对手DeepSeek-R1日益增长压力的回应。这一改变标志着OpenAI在模型透明度策略上的重要转变。

此前,OpenAI一直将"思维链"(Chain of Thought, CoT)视为核心竞争优势而选择隐藏。然而,随着DeepSeek-R1等开放模型完整展示其推理轨迹,这种封闭策略反而成为了OpenAI的短板。新版o3-mini虽然仍未完全开放原始标记,但提供了更清晰的推理过程展示。

QQ20250208-093702.png

在性能和成本方面,OpenAI也在积极追赶。o3-mini的定价降至每百万输出代币4.40美元,远低于早期o1模型的60美元,接近DeepSeek-R1在美国提供商上的7-8美元价位。同时,o3-mini在多个推理基准测试中的表现优于其前代产品。

QQ20250208-093712.png

实际测试显示,o3-mini的详细推理过程展示确实提升了模型的实用性。在处理非结构化数据时,用户能够更好地理解模型的推理逻辑,从而优化提示词以获得更准确的结果。

OpenAI CEO Sam Altman最近承认在开源debate上"站在了历史的错误一边"。随着DeepSeek-R1被多家机构采用和改进,OpenAI未来在开源策略上的调整值得关注。

相关资讯

OpenAI o3 碾压式 AI 数学成绩遭质疑:既当选手又是裁判,翻版 Theranos 世纪骗局

科技媒体 TechCrunch 昨日(1 月 19 日)发布博文,报道称 Epoch AI 因未及时披露 OpenAI 的资助而引发争议,其开发的数学基准测试 FrontierMath 的客观性受到质疑。

o3-mini 思维链公开却被曝光全是“作假”,阿尔特曼现身解释

在展示出来的 CoT 中,o3-mini 一步步思考,这个问题应该是用户在搞幽默,觉得本周应该快结束了,结果还没结束。因此,自己需要给一个聪明机智的回答。

OpenAI 的 o3 模型在 2024 国际信息学奥林匹克竞赛中斩获金牌

近期,OpenAI 发布了一项关于其最新推理模型 o3的研究,展示了大型语言模型(LLM)如何从初学者的竞赛程序员成长为全球顶尖水平的竞争者。 o3在著名编程平台 CodeForces 上取得了2724的评分,位于前99.8% 的百分位,表现相当出色,并在2024年国际信息学奥林匹克(IOI)中获得了金牌级别的成绩。 图源备注:图片由AI生成,图片授权服务商Midjourney研究表明,o3模型在 IOI 比赛中超越了专门为此活动微调的 o1-ioi 模型,这一结果表明,通过强化学习取得的成就要优于手工设计的解决方案。