刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

作者：新智元

2025-04-01 09:17

虽然又被GPT-4o吉卜力生图的光芒掩盖了，但毫无疑问，上周的另一技术核弹Gemini 2.5 Pro，也是无可争议的强！在试用过程中，网友们逐渐发现，这个模型真的强到发指。在门萨Norway的IQ测试中，它已经突破了130。

虽然又被GPT-4o吉卜力生图的光芒掩盖了，但毫无疑问，上周的另一技术核弹Gemini 2.5 Pro，也是无可争议的强！

在试用过程中，网友们逐渐发现，这个模型真的强到发指。

在门萨Norway的IQ测试中，它已经突破了130。

随后，更硬核的证据来了——在MathArena测试中，它直接获得了第一名！

注意，这里用的基本都是LLM从未见过的题。

在哈佛-麻省理工大学数学竞赛（HMMT）中，领先第二名15%

AIME 2025 I和AIME 2025 II是今年美国全国数学奥林匹克竞赛的选拔赛

它在数学方面已经比大多数研究生要强，这已经是一个可以公开验证的事实。

在这位网友统计的AI模型能力表上，Gemini的领先趋势已经非常明显。

Gemini 2.5 Pro (exp)，免费用户也能用

好消息是，现在所有用户都能用上Gemini 2.5 Pro了。

就在今天，谷歌官宣：向所有Gemini用户，推出Gemini 2.5 Pro实验版！

而且，还是全免费。

唯一美中不足的是，Gemini 2.5 Pro目前还会有速率限制。

但Gemini Advanced用户，就可以享有更高级的访问权限，和更大的上下文窗口。

在上周三刚刚发布时，Gemini 2.5 Pro，还仅仅面向Gemini Advanced订阅者开放，订阅价格为每月19.99美元。

而随后，模型还会被推广到安卓和iOS应用上。

目前尚不清楚，谷歌是否会将2.5 Pro的稳定版本免费提供给所有Gemini用户，还是说今天的举措仅针对测试阶段。

在此之前，似乎2.0 Flash Thinking和2.0 Flash都将是免费提供的版本。

社区网友公认：大模型赛，谷歌已经领先了

AI社区Reddit上的网友们公认：在客观上，谷歌的模型已经领先了。

或许是有史以来第一次，OpenAI明确处于落后地位，Anthropic也是如此。

虽然凭吉卜力表情包抢了风头，但这种廉价的伎俩只会在短期内有用。在大模型赛中，局面已经从根本上改变了。

细数LiveBench、LMSYS、人类最后的考试、智商测试，几乎一切投票都表明，Gemini是无可争议的领军者。

有媒体表示谷歌Gemini 2.5 Pro是最聪明的模型

根据Artificial Analysis的评估，Gemini 2.5在大部分测试中都遥遥领先，成绩排名第一。

同时，输出速度仅次于 Gemini 2.0 Flash，位列第二。

当然，如果从原理上看，LLM的确没有在做数学，因为它们的本质仍然是概率性的，是做从训练数据中预测最可能的答案。

最强编程模型：模拟宇宙都可以

谷歌的技术主管Addy Osmani，表示Gemini 2.5 Pro是谷歌最好的编程模型，而且免费！

他给出了一段Gemini制作的3D飞行小游戏。

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

只需提示一次，Gemini 2.5 Pro可以在Three.js中的物理模拟！

多次提示，还可以改进编程效果。

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

开源链接：https://github.com/gemsjohn/physics-sims

网友Gadgetify直接复刻了自己「宇宙模拟器」，只需几次提示。

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

建立AI智能体DAIR.AI的elvis，则认为Gemini 2.5 Pro是Claude 3.7 Sonnet的最强对手。

Gemini 2.5 Pro是一款优质代码模型：

· 代码质量真的很好

· 1M个token的上下文

· 原生多模态

· 长代码生成

· 理解大型代码库

利用Gemini和Windsurf，他生成了AI搜索代理应用。

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

不少网友体验Gemini 2.5 Pro编程之后，表示Claude的确危险了！

初步的编码测试中的结果显示，Gemini 2.5 Pro把行业水平提升了一个档次。

对此，「AI智能体先驱」的创始人Silas Alberti，表示编程助手Devin正在引入Gemini 2.5 Pro。

而从事SEO行业的Julian Goldies放出Gemini 2.5 Pro MCP Servers教程，让智能体自动化一切。

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

甚至，有人用Gemini 2.5 Pro测试了一个项目，使用A*算法为高速列车寻找最优解，这个过程中涉及了优化坡度、转弯半径、多目标优化等难题。

令人惊喜的是，虽然它经常搞乱语法，比如试图把所有代码压缩到一行，但它完成了不少高质量的工作。

相关标签：

AI 模型 Gemini

相关资讯

谷歌发布 3 款 Gemini 实验 AI 模型：1.5 Pro 冲榜第二、1.5 Flash 从第 23 蹿升至第 6

谷歌发布 3 款 Gemini 实验 AI 模型：1.5 Pro 冲榜第二、1.5 Flash 从第 23 蹿升至第 6

谷歌 AI Studio 产品总监洛根・基尔帕特里克（Logan Kilpatrick）今天（8 月 28 日）在 X 平台发布推文，宣布推出 3 款 Gemini 实验性模型。AI在线附上谷歌本次推出的 3 款实验性 Gemini AI 模型如下：Gemini 1.5 Flash-8BGemini 1.5 Flash-8B 是 Gemini 1.5 Flash 的更小尺寸模型，拥有 80 亿参数，专为多模态任务而设计，包括大容量任务和长文本摘要任务。Gemini 1.5 Pro Exp-0827主要增强编程、复杂

91.1% 准确率，性能远超 GPT-4 系列模型，谷歌推出多模态医学大模型 Med-Gemini

91.1% 准确率，性能远超 GPT-4 系列模型，谷歌推出多模态医学大模型 Med-Gemini

编辑 | 萝卜皮各种复杂的医疗应用给人工智能带来了巨大挑战：需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。Gemini 模型在多模态和长上下文推理方面具有强大的通用能力，为 AI 在医学领域应用提供了可能性。基于 Gemini 的核心优势，谷歌的研究人员推出了 Med-Gemini，这是一个功能强大的多模态模型系列，专门用于医学，能够无缝使用网络搜索，并且可以使用自定义编码器有效地针对新颖的模态进行定制。研究人员用 14 项医疗基准评估 Med-Gemini，在其中 10 项上建立了新的最先进（S

ComfyUI 难度骤降一倍！揭秘谷歌Gemini 2.0 Flash的史诗级更新

ComfyUI 难度骤降一倍！揭秘谷歌Gemini 2.0 Flash的史诗级更新

最近，谷歌一口气对 AI 模型能力做了一次大升级，其中最吸引我的是 Gemini 2.0 Flash (Image Generation) ，这个模型对设计师来说，实用性很强。更多新模型的介绍：. 被低估的谷歌？

资讯热榜

ChatGPT“生成吉卜力风格 AI 图”海外潮流引发版权争议，CEO Sam Altman 回应将施以限制 DeepSeek-R1之后推理模型发展如何？Raschka长文梳理后R1时代14篇重要论文宫崎骏“怒了”?ChatGPT吉卜力风潮惹版权争议，OpenAI或面临法律挑战! DeepSeek 月访问量超越 ChatGPT，成为 AI 工具新星 OpenAI 审查策略大转向!ChatGPT 新图像生成器爆红，争议内容限制放宽引关注告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度，多样性飙升23%! 刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1 DeepSeek V3来了老外评测结果：很不错

标签云

评论