GPT-4.5崛起仅六小时便失宠，xAI Grok-3 逆袭夺冠

2025-03-04 02:24

OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内，成功登顶人工智能竞技场，并成为全任务分类的第一名。然而，这一荣耀并未持续太久，马斯克的 xAI Grok-3模型迅速逆袭，反超成为总榜第一名。根据投票数据显示，GPT-4.5与 Grok-3各自获得超过3000票，最终总分为1412对1411，仅差一分。

OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内，成功登顶人工智能竞技场，并成为全任务分类的第一名。然而，这一荣耀并未持续太久，马斯克的 xAI Grok-3模型迅速逆袭，反超成为总榜第一名。

根据投票数据显示，GPT-4.5与 Grok-3各自获得超过3000票，最终总分为1412对1411，仅差一分。尽管 GPT-4.5在大多数项目上表现优秀，但 Grok-3在特定的 “带风格控制” 和 “困难提示词” 任务上略有优势，这使得它在总分上实现了反超。

对于这场 “六小时逆转”，不少用户表示怀疑，认为如此迅速的变化是否合理。对此，有业内人士解释称，竞争榜单设有投票门槛，只有在同一时间内达到3000票的模型才能登上榜单。因此，刚刚发布不久的这两款模型能够同步达到该标准，是一场巧合的结果。

值得一提的是，尽管 GPT-4.5刚发布时面临着一些负面评价，用户对于其高情商的认可度却在日后显著上升。OpenAI 的首席执行官萨姆・奥尔特曼甚至分享了与 GPT-4.5的对话，表示这是他首次收到用户请求其承诺不再下架该模型。

与此同时，GPT-4.5还在一项另类竞赛中取得了优异表现，参与了一场类似于 “大模型狼人杀” 的游戏。在这场比赛中，各大 AI 模型需进行辩论、策略制定与投票，最终的胜者由被淘汰的成员组成的陪审团决定。GPT-4.5在合作、欺骗及策略制定等方面展现出超越人类的优秀表现。

这一切都表明，人工智能的竞争愈加激烈，各大模型在各自领域内不断创新、提升。未来，谁将最终赢得这场智能之战，值得我们持续关注。

马斯克称 Grok 3 将于 2 月 18 日发布：地球上最聪明的人工智能

马斯克在社交平台 X 上表示，Grok 3 大模型将于太平洋时间周一晚上 8 点（IT之家注：北京时间 2 月 17 日 12 点）发布，届时将进行现场演示，马斯克称其为地球上最聪明的人工智能。

2/16/2025 11:23:49 AM

远洋

OpenAI推全新语音转录模型gpt-4o-transcribe，语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后，OpenAI并未停下在该领域探索的脚步，现在这家ChatGPT的创造者再次发力，推出了三款全新的自主研发语音模型，分别为:gpt-4o-transcribe， gpt-4o-mini-transcribe and gpt-4o-mini-tts。其中最受瞩目的当属gpt-4o-transcribe。目前，这些新模型已经率先通过应用程序接口（API）向第三方开发者开放，开发者们可以利用它们打造更智能的应用程序。

3/21/2025 9:01:00 AM

AI在线

OpenAI发布GPT-4.1系列模型：能力全面超越前代

4月15日，OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型，涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。该系列在编程能力、指令理解及长文本处理等方面实现重大突破，全面超越前代 GPT-4o 及 GPT-4o mini。其中，模型上下文窗口扩展至100万 tokens，知识库更新至2024年6月，为复杂任务提供更强支持。

4/15/2025 9:00:45 AM

AI在线

资讯热榜

本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 GPT-4o提效神器！8种王炸用法让小白秒变大神（附提示词模版）斯坦福 AI 指数报告发布：2024年美国 AI 私人投资约为中国的 12 倍、GPT3.5 级别模型推理成本下降 280 倍如何用AI做好情感化设计？来看大厂的实战案例！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

GPT-4.5崛起仅六小时便失宠，xAI Grok-3 逆袭夺冠

相关资讯

马斯克称 Grok 3 将于 2 月 18 日发布：地球上最聪明的人工智能

OpenAI推全新语音转录模型gpt-4o-transcribe，语音转文字准确率飙升

OpenAI发布GPT-4.1系列模型：能力全面超越前代