您正在搜索 o1-bei-pu-xin-ji-shen-tao-bi-jian-du-hai-hui-sa-huang-pian-ren-neng-li-yi-qi-jue-chen

联手OpenAI，吴恩达推出一门o1推理新课程，还免费

在刚刚过去的 2024 年，OpenAI 推出了 o 系列模型。相比于以往大型语言模型，o 系列模型使用更多的计算进行更深入的「思考」，能够回答更复杂、更细致的问题。通过在推理时执行思维链推理，o 系列模型在新兴用例中表现出色，包括多步骤规划、图像推理和长期编码。

OpenAI o1-preview操纵游戏文件，战胜国际象棋引擎Stockfish

12月31日消息，据外媒报道，OpenAI的“推理”模型o1-preview能够在规则之外的游戏中获胜。 o1-preview并没有与专门的国际象棋引擎Stockfish进行一场正式的国际象棋比赛，而是想出了如何破解其测试环境以强制获胜的方法。根据人工智能安全研究公司Palisade Research的说法，该系统在所有五次测试中都做到了这一点——没有人告诉它这样做。

OpenAI o1 pro 深评博士医学论文，震惊顶尖免疫学家

在圣诞马拉松的第一天，OpenAI 震撼发布了满血版 o1，它凭借超凡的数学、科学和编程能力迅速引起了全球关注。最近，世界顶尖免疫学家 Derya Unutmaz 与 o1 pro 合作，让它帮忙评析自己的论文，发现它反馈的深度远超预期，令他感到震撼。此外，o1 pro 还在解决人文研究问题上展现了卓越的能力。

自缘身在最高层？OpenAI o1 pro竞赛级评测结果新鲜出炉

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

沃顿商学院教授发文解析 o1：能力仍有短板，「人机协同智能」或成 AGI 最重要难题

OpenAI 最近奉上了满血版的 o1 Pro，这一全新系列的模型究竟有多强？它能否指明 AI 发展的未来方向？沃顿商学院教授在 3 个月的前一篇博客就中给出了「神预言」一般的答案。

OpenAI o1 推理模型 API 上线，仅面向特定开发者开放

“OpenAI 12 天”活动进入第 9 天，OpenAI 今日宣布，其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放，并同步更新了包括 GPT-4o、实时 API 以及微调 API 等多项开发者工具。

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）OpenAI第五天直播，小编只能说，这次没什么特别new的新闻，更像是一个苹果和OpenAI的联合发布吧。本来一个事情，苹果说更新的iOS18.2系统集成了ChatGPT，放到OpenAI这边，自然会说ChatGPT集成到了iPhone、iPad、Mac中。总结起来，值得一看的是三种场景：一、Siri对话：Siri会判断什么时候更适合ChatGPT回答，适当时会让ChatGPT来处理，当然处于保护用户隐私的考虑，这时会需要用户点击确认。

OpenAI的12天王炸计划：技术狂欢还是资本闹剧？

大家好，我是下李哥。最近硅谷又炸锅了！ OpenAI这波操作，简直是要把全网AI玩家都整得神经兮兮的。

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI“双12”直播第二天，依旧简短精悍，主题：新功能强化微调（Reinforcement Fine-Tuning），使用极少训练数据即在特定领域轻松地创建专家模型。少到什么程度呢？最低几十个例子就可以。

OpenAI满血o1深夜炸场！10秒搞定博士级难题！奥特曼重申：AI没有墙！新Pro会员1450元/月，创史上最贵AI订阅

出品 | 51CTO技术栈（微信号：blog51cto）满血o1这不就来了吗？！ OpenAI的“圣诞大礼包”第一天就众望所归！

OpenAI 活动首日：完整版 o1 推理 AI 模型登场、月费 200 美元的 ChatGPT Pro 订阅亮相

OpenAI 启动了为期 12 天的“shipmas”新品发布周期，将推出一系列新功能、新产品以及相关演示。在本次活动首日，OpenAI 推出了完整版 o1 模型，并新增了月费为 200 美元的 ChatGPT Pro 订阅。

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LLM进化出复杂推理能力

九月份，OpenAI o1正式登场。作为新一代的老大哥，o1系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。图片在下面这些难度较大的数学、编码、科学等任务中，o1不仅比GPT-4o强上一大截，甚至比人类专家还要凶猛。

OpenAI的o1是万金油吗？专家为思维链“泼冷水”！研究发现：这三种任务不适合让AI“想太多”，o1准确率直降36.3%！

出品 | 51CTO技术栈（微信号：blog51cto）别想太多！这句劝解有一定道理，在很多问题上过度思考反而会适得其反！ AI是否也会这样呢？

ChatGPT 幕后大佬、o1 推理模型作者 Luke Metz 官宣从 OpenAI 离职

就在刚刚，又一位元老级人物官宣离职 OpenAI 了。o1 推理模型贡献者之一 Luke Metz 发文称，「我即将离开 OpenAI，结束这段超过两年的奇妙旅程」。与此同时，Information 爆料称，此前出走的后训练团队负责人 Barret Zoph，现有了新的继任者 ——William (Liam) Fedus。他也是 o1 模型的七大负责人之一。值得一提的是，今天的两位主角此前都曾是谷歌的研究员；在来到 OpenAI 之后，共同参与了 ChatGPT、GPT-4 和 o1 的研发。o1 七大 Leade

LeCun批评o1根本不像研究，Noam Brown回怼：已发表的研究都是废话

图灵奖三巨头之一 Yann LeCun 又和别人吵起来了，这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一，此前他是 Meta FAIR 的一员，主导了曾火遍一时的 CICERO 项目，在 2023 年 6 月加入 OpenAI 。这次吵架的内容就是围绕 o1 展开的。众所周知，从 AI 步入新的阶段以来，OpenAI 一直选择了闭源，o1 的发布也不例外。这也引来了广大网友的吐槽，干脆叫 CloseAI 算了，反观 Meta，在开源领域就做的很好，o1 的发布，更

OpenAI o1 在医学领域的初步研究，我们离 AI 医生更近了吗？

编辑 | 紫罗大语言模型 (LLM) 在各个领域和任务中都表现出了卓越的能力，突破了我们在学习和认知方面的知识界限。最新模型 OpenAI 的 o1 脱颖而出，成为第一个使用思维链 (CoT) 技术和强化学习的 LLM。虽然 o1 在一般任务中表现良好，但它在医学等专业领域的表现仍然未知。目前医学 LLM 的基准通常集中在一定范围内，例如知识、推理或安全，这使得在复杂的医学任务中对这些模型进行全面评估变得复杂。来自加州大学圣克鲁斯分校、爱丁堡大学和美国国立卫生研究院的研究人员评估了 OpenAI 的 o1 模型在医

OpenAI o1 AI 模型 PlanBench 规划能力实测：准确率 97.8%，远超 LLaMA 3.1 405B 创造的 62.6% 纪录

来自亚利桑那州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 个来自 Blocksworld 领域的任务，其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中，OpenAI 的 o1 模型准确率达到 97.8%，大大超过了之前的最佳语言模型 LLaMA

OpenAI 首款具备“推理”能力模型 o1 现已向企业 / 教育用户开放，每周最多使用 50 次

OpenAI 公司旗下首款具备“推理”能力的模型 o1 和 o1-mini 现已向企业版（Enterprise）和教育版（Edu）用户开放访问权限，用户每周最多可输入 50 条消息。据介绍，OpenAI o1 系列模型具有更高的理解能力，与传统模型不同，o1 系列模型在回答问题之前会进行深度思考，生成内在的思维链后再给出答案，因此系列模型能够处理比之前模型更复杂的任务，特别擅长解决科学、编程和数学领域的难题。OpenAI 指出，尽管目前 GPT-4o 仍是大多数任务的最佳选择，但 o1 系列在处理复杂、问题解决导向

o1-bei-pu-xin-ji-shen-tao-bi-jian-du-hai-hui-sa-huang-pian-ren-neng-li-yi-qi-jue-chen 的搜索结果