AIGC宇宙 AIGC宇宙

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

作者:故渊
2025-04-15 06:38
OpenAI发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,性能全面超越前代,编程、指令遵循和长文本处理表现优异,成本更低。#AI##OpenAI#

OpenAI 公司今天(4 月 15 日)发布博文,宣布以 API 的形式发布 GPT-4.1 系列模型,涵盖 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

这些模型在编程、指令遵循和长文本理解方面全面超越前代 GPT-4o 及 GPT-4o mini,上下文窗口最高支持 100 万 tokens,知识更新至 2024 年 6 月。

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

需要注意的是,该系列模型现阶段专为开发者打造,目前仅通过开发者 API 方式提供,普通用户暂时无法通过 ChatGPT 页面体验该模型。

OpenAI 表示在编程方面,相比较 GPT-4o 模型,GPT-4.1 模型的代码生成速度飙升 40%,且用户输入查询的成本降低了 80%。

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

新模型性能

OpenAI 在官方博文中表示,GPT-4.1 系列模型在编程、指令遵循和长文本处理上表现优异,全面超越 GPT-4o 及 GPT-4o mini。

GPT-4.1 在编程测试 SWE-bench Verified 中得分 54.6%,较 GPT-4o 提升 21.4 个百分点,在指令遵循测试 MultiChallenge 中提升 10.5 个百分点,在多模态长文本测试 Video-MME 中创下 72.0% 的新纪录。

GPT-4.1 mini 和 nano 展现了小型模型的巨大潜力。GPT-4.1 mini 在多项基准测试中媲美甚至超越 GPT-4o,延迟降低近一半,成本减少 83%。

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

GPT-4.1 nano 作为最快、最经济的选择,拥有 100 万个 token 的上下文窗口,在 MMLU 测试中得分 80.1%,适合分类和自动补全任务。

这些模型通过优化推理栈和提示缓存技术,显著降低了首次响应时间,为开发者提供高效低成本的解决方案。

GPT-4.1 系列模型在实际应用中表现突出,特别适合构建智能代理,处理复杂任务。例如,Windsurf 测试显示,GPT-4.1 在编程效率上提升 30%,减少 50% 不必要编辑;Thomson Reuters 的法律 AI 助手 CoCounsel 使用 GPT-4.1 后,多文档审查准确率提升 17%。

命名混乱引发关注

GPT-4.1 的发布加剧了 OpenAI 产品命名的复杂性。

ChatGPT 目前已包含 GPT-4o、GPT-4o mini、o1-pro 等多种模型选项。OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)早在 2024 年 2 月就承认命名问题。

他在 X 平台表示,产品线过于繁杂,计划通过未来的 GPT-5 整合品牌,OpenAI 计划在 2025 年 7 月前逐步淘汰 API 中的 GPT-4.5 Preview 模型,从而缓解命名混乱。

这一临时模型于 2024 年 2 月推出,曾被批评为“失败品”,开发者需在 2025 年 7 月前迁移到其他模型,不过,GPT-4.5 在 ChatGPT 中暂时保留,未受影响。

费用

API 价格方面,OpenAI GPT-4.1 模型每  100 万 tokens 输入费用为 2 美元(AI在线注:现汇率约合 14.6 元人民币),每  100 万 tokens 输出费用为 8 美元(现汇率约合 58.3 元人民币)。在中等查询中,相比较 GPT-4o,GPT-4.1 不仅能提供更强悍的性能,而且便宜 26%。

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

此外,OpenAI GPT-4.1 nano 是 OpenAI 最便宜、最快的模型:

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

相关标签:

相关资讯

昆仑万维推出 Skywork-OR1 系列模型:全面开放、免费使用、完全开源

昆仑万维今日发文宣布,天工团队在首款中文逻辑推理大模型 Skywork-o1 基础上迭代优化,推出了全新升级的 Skywork-OR1(Open Reasoner 1) 系列模型。
4/13/2025 9:53:09 PM
归泷

OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后,OpenAI并未停下在该领域探索的脚步,现在这家ChatGPT的创造者再次发力,推出了三款全新的自主研发语音模型,分别为:gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。 其中最受瞩目的当属gpt-4o-transcribe。 目前,这些新模型已经率先通过应用程序接口(API)向第三方开发者开放,开发者们可以利用它们打造更智能的应用程序。
3/21/2025 9:01:00 AM
AI在线

OpenAI发布GPT-4.1系列模型:能力全面超越前代

4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。 该系列在编程能力、指令理解及长文本处理等方面实现重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。 其中,模型上下文窗口扩展至100万 tokens,知识库更新至2024年6月,为复杂任务提供更强支持。
4/15/2025 9:00:45 AM
AI在线