AIGC宇宙 AIGC宇宙

GPT-4.5崛起仅六小时便失宠,xAI Grok-3 逆袭夺冠

作者:AI在线
2025-03-04 02:24
OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内,成功登顶人工智能竞技场,并成为全任务分类的第一名。 然而,这一荣耀并未持续太久,马斯克的 xAI Grok-3模型迅速逆袭,反超成为总榜第一名。 根据投票数据显示,GPT-4.5与 Grok-3各自获得超过3000票,最终总分为1412对1411,仅差一分。

OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内,成功登顶人工智能竞技场,并成为全任务分类的第一名。然而,这一荣耀并未持续太久,马斯克的 xAI Grok-3模型迅速逆袭,反超成为总榜第一名。

根据投票数据显示,GPT-4.5与 Grok-3各自获得超过3000票,最终总分为1412对1411,仅差一分。尽管 GPT-4.5在大多数项目上表现优秀,但 Grok-3在特定的 “带风格控制” 和 “困难提示词” 任务上略有优势,这使得它在总分上实现了反超。

image.png

对于这场 “六小时逆转”,不少用户表示怀疑,认为如此迅速的变化是否合理。对此,有业内人士解释称,竞争榜单设有投票门槛,只有在同一时间内达到3000票的模型才能登上榜单。因此,刚刚发布不久的这两款模型能够同步达到该标准,是一场巧合的结果。

值得一提的是,尽管 GPT-4.5刚发布时面临着一些负面评价,用户对于其高情商的认可度却在日后显著上升。OpenAI 的首席执行官萨姆・奥尔特曼甚至分享了与 GPT-4.5的对话,表示这是他首次收到用户请求其承诺不再下架该模型。

image.png

与此同时,GPT-4.5还在一项另类竞赛中取得了优异表现,参与了一场类似于 “大模型狼人杀” 的游戏。在这场比赛中,各大 AI 模型需进行辩论、策略制定与投票,最终的胜者由被淘汰的成员组成的陪审团决定。GPT-4.5在合作、欺骗及策略制定等方面展现出超越人类的优秀表现。

这一切都表明,人工智能的竞争愈加激烈,各大模型在各自领域内不断创新、提升。未来,谁将最终赢得这场智能之战,值得我们持续关注。

相关标签:

相关资讯

马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能

马斯克在社交平台 X 上表示,Grok 3 大模型将于太平洋时间周一晚上 8 点(IT之家注:北京时间 2 月 17 日 12 点)发布,届时将进行现场演示,马斯克称其为地球上最聪明的人工智能。
2/16/2025 11:23:49 AM
远洋

OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后,OpenAI并未停下在该领域探索的脚步,现在这家ChatGPT的创造者再次发力,推出了三款全新的自主研发语音模型,分别为:gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。 其中最受瞩目的当属gpt-4o-transcribe。 目前,这些新模型已经率先通过应用程序接口(API)向第三方开发者开放,开发者们可以利用它们打造更智能的应用程序。
3/21/2025 9:01:00 AM
AI在线

OpenAI发布GPT-4.1系列模型:能力全面超越前代

4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。 该系列在编程能力、指令理解及长文本处理等方面实现重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。 其中,模型上下文窗口扩展至100万 tokens,知识库更新至2024年6月,为复杂任务提供更强支持。
4/15/2025 9:00:45 AM
AI在线