o1-bei-pu-xin-ji-shen-tao-bi-jian-du-hai-hui-sa-huang-pian-ren-neng-li-yi-qi-jue-chen 的搜索结果
联手OpenAI,吴恩达推出一门o1推理新课程,还免费
在刚刚过去的 2024 年,OpenAI 推出了 o 系列模型。 相比于以往大型语言模型,o 系列模型使用更多的计算进行更深入的「思考」,能够回答更复杂、更细致的问题。 通过在推理时执行思维链推理,o 系列模型在新兴用例中表现出色,包括多步骤规划、图像推理和长期编码。
OpenAI o1-preview操纵游戏文件,战胜国际象棋引擎Stockfish
12月31日消息,据外媒报道,OpenAI的“推理”模型o1-preview能够在规则之外的游戏中获胜。 o1-preview并没有与专门的国际象棋引擎Stockfish进行一场正式的国际象棋比赛,而是想出了如何破解其测试环境以强制获胜的方法。 根据人工智能安全研究公司Palisade Research的说法,该系统在所有五次测试中都做到了这一点——没有人告诉它这样做。
OpenAI o1 pro 深评博士医学论文,震惊顶尖免疫学家
在圣诞马拉松的第一天,OpenAI 震撼发布了满血版 o1,它凭借超凡的数学、科学和编程能力迅速引起了全球关注。最近,世界顶尖免疫学家 Derya Unutmaz 与 o1 pro 合作,让它帮忙评析自己的论文,发现它反馈的深度远超预期,令他感到震撼。此外,o1 pro 还在解决人文研究问题上展现了卓越的能力。
自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
沃顿商学院教授发文解析 o1:能力仍有短板,「人机协同智能」或成 AGI 最重要难题
OpenAI 最近奉上了满血版的 o1 Pro,这一全新系列的模型究竟有多强?它能否指明 AI 发展的未来方向?沃顿商学院教授在 3 个月的前一篇博客就中给出了「神预言」一般的答案。
OpenAI o1 推理模型 API 上线,仅面向特定开发者开放
“OpenAI 12 天”活动进入第 9 天,OpenAI 今日宣布,其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放,并同步更新了包括 GPT-4o、实时 API 以及微调 API 等多项开发者工具。
OpenAI犯了大公司病
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)OpenAI第五天直播,小编只能说,这次没什么特别new的新闻,更像是一个苹果和OpenAI的联合发布吧。 本来一个事情,苹果说更新的iOS18.2系统集成了ChatGPT,放到OpenAI这边,自然会说ChatGPT集成到了iPhone、iPad、Mac中。 总结起来,值得一看的是三种场景:一、Siri对话:Siri会判断什么时候更适合ChatGPT回答,适当时会让ChatGPT来处理,当然处于保护用户隐私的考虑,这时会需要用户点击确认。
OpenAI的12天王炸计划:技术狂欢还是资本闹剧?
大家好,我是下李哥。 最近硅谷又炸锅了! OpenAI这波操作,简直是要把全网AI玩家都整得神经兮兮的。
OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
OpenAI“双12”直播第二天,依旧简短精悍,主题:新功能强化微调(Reinforcement Fine-Tuning),使用极少训练数据即在特定领域轻松地创建专家模型。 少到什么程度呢? 最低几十个例子就可以。
OpenAI满血o1深夜炸场!10秒搞定博士级难题!奥特曼重申:AI没有墙!新Pro会员1450元/月,创史上最贵AI订阅
出品 | 51CTO技术栈(微信号:blog51cto)满血o1这不就来了吗? ! OpenAI的“圣诞大礼包”第一天就众望所归!
OpenAI 活动首日:完整版 o1 推理 AI 模型登场、月费 200 美元的 ChatGPT Pro 订阅亮相
OpenAI 启动了为期 12 天的“shipmas”新品发布周期,将推出一系列新功能、新产品以及相关演示。在本次活动首日,OpenAI 推出了完整版 o1 模型,并新增了月费为 200 美元的 ChatGPT Pro 订阅。
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
九月份,OpenAI o1正式登场。 作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。 图片在下面这些难度较大的数学、编码、科学等任务中,o1不仅比GPT-4o强上一大截,甚至比人类专家还要凶猛。
OpenAI的o1是万金油吗?专家为思维链“泼冷水”!研究发现:这三种任务不适合让AI“想太多”,o1准确率直降36.3%!
出品 | 51CTO技术栈(微信号:blog51cto)别想太多! 这句劝解有一定道理,在很多问题上过度思考反而会适得其反! AI是否也会这样呢?
ChatGPT 幕后大佬、o1 推理模型作者 Luke Metz 官宣从 OpenAI 离职
就在刚刚,又一位元老级人物官宣离职 OpenAI 了。o1 推理模型贡献者之一 Luke Metz 发文称,「我即将离开 OpenAI,结束这段超过两年的奇妙旅程」。与此同时,Information 爆料称,此前出走的后训练团队负责人 Barret Zoph,现有了新的继任者 ——William (Liam) Fedus。他也是 o1 模型的七大负责人之一。值得一提的是,今天的两位主角此前都曾是谷歌的研究员;在来到 OpenAI 之后,共同参与了 ChatGPT、GPT-4 和 o1 的研发。o1 七大 Leade
LeCun批评o1根本不像研究,Noam Brown回怼:已发表的研究都是废话
图灵奖三巨头之一 Yann LeCun 又和别人吵起来了,这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一,此前他是 Meta FAIR 的一员,主导了曾火遍一时的 CICERO 项目,在 2023 年 6 月加入 OpenAI 。这次吵架的内容就是围绕 o1 展开的。众所周知,从 AI 步入新的阶段以来,OpenAI 一直选择了闭源,o1 的发布也不例外。这也引来了广大网友的吐槽,干脆叫 CloseAI 算了,反观 Meta,在开源领域就做的很好,o1 的发布,更
OpenAI o1 在医学领域的初步研究,我们离 AI 医生更近了吗?
编辑 | 紫罗大语言模型 (LLM) 在各个领域和任务中都表现出了卓越的能力,突破了我们在学习和认知方面的知识界限。最新模型 OpenAI 的 o1 脱颖而出,成为第一个使用思维链 (CoT) 技术和强化学习的 LLM。虽然 o1 在一般任务中表现良好,但它在医学等专业领域的表现仍然未知。目前医学 LLM 的基准通常集中在一定范围内,例如知识、推理或安全,这使得在复杂的医学任务中对这些模型进行全面评估变得复杂。来自加州大学圣克鲁斯分校、爱丁堡大学和美国国立卫生研究院的研究人员评估了 OpenAI 的 o1 模型在医
OpenAI o1 AI 模型 PlanBench 规划能力实测:准确率 97.8%,远超 LLaMA 3.1 405B 创造的 62.6% 纪录
来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 个来自 Blocksworld 领域的任务,其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中,OpenAI 的 o1 模型准确率达到 97.8%,大大超过了之前的最佳语言模型 LLaMA
OpenAI 首款具备“推理”能力模型 o1 现已向企业 / 教育用户开放,每周最多使用 50 次
OpenAI 公司旗下首款具备“推理”能力的模型 o1 和 o1-mini 现已向企业版(Enterprise)和教育版(Edu)用户开放访问权限,用户每周最多可输入 50 条消息。据介绍,OpenAI o1 系列模型具有更高的理解能力,与传统模型不同,o1 系列模型在回答问题之前会进行深度思考,生成内在的思维链后再给出答案,因此系列模型能够处理比之前模型更复杂的任务,特别擅长解决科学、编程和数学领域的难题。OpenAI 指出,尽管目前 GPT-4o 仍是大多数任务的最佳选择,但 o1 系列在处理复杂、问题解决导向