AIGC宇宙 AIGC宇宙

OpenAI 上线 Flex 处理模式:API 费用减半,但牺牲响应速度及稳定性

作者:清源
2025-04-18 09:13
OpenAI宣布推出“Flex处理模式”新的API服务——用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。

据外媒 TechCrunch 今日报道,为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入,OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。

OpenAI 表示,Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试,主要面向模型评估、数据扩充、异步处理等优先级较低的“非生产”任务。

采用 Flex 处理,API 费用将直接减半。以 o3 为例,Flex 模式下的费用为每百万输入 tokens 收取 5 美元(AI在线注:现汇率约合 36.5 元人民币,相当于约合 75 万字),每百万输出 tokens 收取 20 美元(现汇率约合 146 元人民币)。

作为参考,标准价格分别为 10 美元和 40 美元。对于 o4-mini,Flex 模式的费用则从每百万输入 tokens 收取 1.10 美元、每百万输出 tokens 收取 4.40 美元,降至每百万输入 tokens 收取 0.55 美元(现汇率约合 4 元人民币)和每百万输出 tokens 收取 2.20 美元(现汇率约合 16.1 元人民币)。

OpenAI 在向客户发送的通知邮件中还表示,按照公司用户的消费层级划分,处于第 1 至第 3 层的开发者必须完成新上线的身份验证流程,方可获取 o3 的访问权限。此外,OpenAI 指出,o3 及其他模型的推理摘要功能和流式 API 服务同样需要完成身份验证后才能启用。

OpenAI 此前强调,身份验证机制的目的是防止用户违反公司制定的使用政策。

相关标签:

相关资讯

OpenAI o3 模型运行成本估算大幅上调:单次任务从 3000 美元涨至 3 万美元

Arc Prize Foundation 大幅上调 OpenAI o3 模型运行成本估算,从 3000 美元涨至 3 万美元。高昂成本凸显 AI 模型特定任务的高成本难题,控制成本成行业挑战。##AI模型成本##
4/3/2025 7:59:45 AM
远洋

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo,我们看了不少,评估 o1 表现的评测,全网比比皆是,关于 o1 技术路线的讨论也如火如荼,引发了广泛的关注和深入的思考。不过 o1 背后的故事,还鲜为人知,那些在幕后默默付出的团队成员们,他们的故事同样值得被讲述和铭记。刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o
9/22/2024 1:27:00 PM
机器之心

LeCun批评o1根本不像研究,Noam Brown回怼:已发表的研究都是废话

图灵奖三巨头之一 Yann LeCun 又和别人吵起来了,这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一,此前他是 Meta FAIR 的一员,主导了曾火遍一时的 CICERO 项目,在 2023 年 6 月加入 OpenAI  。这次吵架的内容就是围绕 o1 展开的。众所周知,从 AI 步入新的阶段以来,OpenAI 一直选择了闭源,o1 的发布也不例外。这也引来了广大网友的吐槽,干脆叫 CloseAI 算了,反观 Meta,在开源领域就做的很好,o1 的发布,更
9/30/2024 2:12:00 PM
机器之心