模型

GPT-4.5被DeepSeek 500倍吊打！基准测试全班垫底，OpenAI痛失护城河

自从OpenAI发布GPT-4.5之后，Ilya这张图又开始火了。 GPT-4.5令人失望的表现，再次印证了Ilya这句话的含金量：预训练已经达到极限，推理Scaling才是未来有希望的范式。 GPT-4.5在基准测试上并没有提升，推理没有增强，只是变成了一个更易于合作、更有创造性、幻觉更少的模型。

3/3/2025 8:00:00 AM

新智元

OpenAI自爆：GPT-4.5 并非前沿模型！奥特曼称OpenAI的GPU已用光，还透露了一个“转型”思路？

编辑 | 伊风"GPT-4.5 并非前沿模型，但它是OpenAI最大的 LLM，比 GPT-4 的计算效率提高了 10 倍以上"。图片这句话就这么水灵灵地出现在GPT-4.5官方给的System Card（系统卡）中。，竟然等来一句“不是前沿模型”这么让人失望的话。

2/28/2025 1:01:06 PM

伊风

GPT-4.5发布：价格飙升30倍能力提升引发热议

2025 年 2 月 27 日，OpenAI正式发布了其最新聊天模型GPT-4.5，这一消息迅速在Twitter（现为X平台）上引发了广泛讨论。作为OpenAI迄今为止最强大的对话模型，GPT-4. 5 在性能上实现了显著突破，但其高昂的价格也让用户和开发者们议论纷纷。

2/28/2025 10:09:32 AM

AI在线

OpenAI 发布 GPT-4.5：迄今最强大模型亮相强化推理与情感智能

2025年2月27日—— OpenAI 于今日正式推出其最新语言模型 GPT-4.5，作为研究预览版率先提供给 ChatGPT Pro 用户（每月订阅费200美元）。这款被誉为“迄今为止最大、最知识渊博”的模型基于 GPT-4o 构建，在推理能力、情感智能以及写作、编程等实用功能上实现显著提升。 OpenAI 表示，未来几周内，GPT-4.5将逐步开放给 Plus、Team、Enterprise 和 Edu 用户，标志着人工智能技术的又一里程碑。

2/28/2025 8:22:00 AM

AI在线

OpenAI正式发布GPT-4.5 率先向ChatGPT Pro用户开放

2月28日，OpenAI通过官方博文宣布，其最新研发的GPT-4.5AI模型已正式亮相。这款模型被OpenAI标榜为其目前最大、表现最佳的聊天模型，并将以研究预览版的身份率先向ChatGPT Pro用户开放体验。 GPT-4.5在预训练和后训练规模上进行了显著扩大，这一改变直接提升了其非监督学习能力。

2/28/2025 7:55:00 AM

AI在线

腾讯混元新一代快思考模型 Turbo S 发布即将在腾讯元宝中上线

2025年2月27日，腾讯正式发布混元新一代快思考模型Turbo S，标志着大模型技术在响应速度和性能优化方面取得了重要突破。与传统的慢思考模型如Deepseek R1和混元T1不同，混元Turbo S能够实现“秒回”，大幅提升输出答案的速度，吐字速度提升一倍，首字时延降低44%。这一创新使得模型在知识、数理、创作等多个领域表现出色，为大模型的快速响应能力提供了新的解决方案。

2/27/2025 5:38:00 PM

AI在线

DeepSeek今日连开3源！针对优化的并行策略，梁文锋本人参与开发

按时整活！ DeepSeek开源周第四天，直接痛快「1日3连发」，且全都围绕一个主题：优化并行策略。 DualPipe：一种创新的双向流水线并行算法，能够完全重叠前向和后向计算-通信阶段，并减少“流水线气泡”。

2/27/2025 1:10:00 PM

量子位

DeepSeek开源三箭齐发，梁文峰亲自上阵！双向并行LLM训练飙升

开源周第4天，DeepSeek放出的是——优化并行策略，一共三个项目。 DualPipe：一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法EPLB：一个针对V3/R1的专家并行负载均衡工具深入分析V3/R1模型中的计算与通信重叠机制值得一提的是，DualPipe是由三个人——Jiashi Li、Chengqi Deng和梁文峰共同研发。有网友对此表示，这是一个颠覆性的突破。

2/27/2025 12:06:45 PM

新智元

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

当地时间2月25日，AAAI 2025 在美国宾夕法尼亚州费城举办，会议为期8天，于3月4日结束。 AAAI 由国际人工智能促进协会主办，是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一，也是中国计算机学会（CCF）推荐的A类国际学术会议，每年举办一届。 AAAI 2025 共有12957篇有效投稿，录用3032篇，录取率为 23.4%。

2/27/2025 10:28:00 AM

新闻助手

曝GPT-4.5本周空降！1T激活参数，120T训练数据，会吐出阶段性思考成果然后继续思考

嚯，万众期待的GPT-4.5，本周就要空降发布？！部分用户的ChatGPT安卓版本（1.2025.056 测试版）上，已经出现了“GPT-4.5研究预览（GPT-4.5 research preview）”的字样。

2/27/2025 9:49:15 AM

量子位

OpenAI Deep Research已向所有付费用户开放，系统卡发布

相信很多用户已经见识过或至少听说过 Deep Research 的强大能力。今天凌晨，OpenAI 宣布 Deep Research 已经面向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用户推出（刚发布时仅有 Pro 用户可用），同时，OpenAI 还发布了 Deep Research 系统卡。此外，OpenAI 研究科学家 Noam Brown 还在 𝕏 上透露：Deep Research 使用的基础模型是 o3 正式版，而非 o3-mini。

2/27/2025 9:45:50 AM

机器之心

ScaleOT框架亮相AAAI 2025：提升隐私保护50%，降算力成本90%

近日，在全球人工智能顶级学术会议AAAI2025期间，蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出创新的跨域微调（offsite-tuning）框架——ScaleOT。该框架能在模型性能无损前提下，将隐私保护效果提升50%，与知识蒸馏技术相比，算力消耗显著降低90%，为百亿级参数模型的跨域微调提供高效轻量化方案，论文因创新性入选AAAI的oral论文(本届大会近13000篇投稿，口头报告比例仅4.6%)。跨域微调是目前业内保护模型产权与数据隐私的主流方案，通过有损压缩将大模型转换为仿真器，数据持有方基于其训练适配器并返回给大模型完成调优，数据和模型均未出域，可保护双方隐私，但存在局限性:一是“均匀抽积木”式处理易致模型关键层缺失，使性能显著下降;二是用蒸馏技术弥补性能损失，计算成本高;且现有方法隐私保护缺乏灵活性。

2/26/2025 2:13:00 PM

AI在线

幻方量化回应DeepSeek-R2模型提前发布：以官方消息为准

据券商中国消息，针对“DeepSeek新一代AI模型R2提前发布”的传闻，幻方量化相关人士作出回应，表示一切以官方消息为准。据悉，幻方量化于2023年7月17日成立深度求索AI公司，并在今年1月成功发布了DeepSeek-R1模型。而近日，路透社援引三位知情人士的消息称，DeepSeek正在加速推进R2模型的发布计划，原定于5月发布的计划现正努力提前。

2/26/2025 8:59:00 AM

AI在线

DeepSeek开放平台API充值服务已正式恢复

近日，DeepSeek API开放平台发布消息，宣布其API充值服务已正式恢复。此前，由于服务器资源紧张，DeepSeek于2月6日暂停了API服务的充值功能。此次恢复充值的同时，DeepSeek也对部分模型调用价格进行了调整。

2/25/2025 3:11:00 PM

AI在线

微软急刹车，被曝撤掉大波数据中心租赁！DeepSeek冲击，算力泡沫要破？

一个月内，微软市值已暴跌了3171亿美元，时间点正好是从DeepSeek在华尔街掀起风暴开始。而就在刚刚，根据Bloomberg透露，作为OpenAI的最大支持者，微软已经取消了部分AI数据中心的租赁。具体来说，微软在美国至少与两家私人运营商取消了协议，总计取消了「数百兆瓦」的租赁，相当于大约两个数据中心。

2/25/2025 1:00:00 PM

新智元

苹果计划将谷歌Gemini引入iOS：iOS 18.4测试版泄露第三方AI模型选项

最新消息显示，苹果公司正计划为其海外版iPhone和iPad引入谷歌Gemini模型，进一步扩展其人工智能生态布局。据悉，苹果在2024年WWDC大会上宣布与OpenAI合作，将ChatGPT集成至iOS18系统，但这并非其为iPhone规划的唯一AI模型。除了传闻中针对国行iPhone的阿里系模型外，谷歌Gemini也有望成为海外用户的新选择。

2/25/2025 11:17:00 AM

AI在线

双擎升级！商汤大装置DeepSeek企业版上线+免费版扩容

今年2月，商汤大装置万象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型，并为免费版提供3个月内千万Token额度，受到客户的热烈响应。为了更好的服务用户，经过系列优化，，现正式推出企业版，同时完成免费版国产化适配与算力扩容，形成专业强支撑普惠广覆盖的双擎驱动！登录官网，即刻体验！

2/24/2025 4:48:00 PM

新闻助手

DeepSeek 开源周首日：开源 FlashMLA，AI 推理速度再进化！

DeepSeek 开源周day1 推出 FlashMLA！专为Hopper 架构 GPU打造的超高效 MLA (Multi-Layer Attention) 解码内核，现在已经正式开源啦！ 👏什么是 FlashMLA？

2/24/2025 10:07:04 AM

AI寒武纪

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了如何用AI做好情感化设计？来看大厂的实战案例！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

模型

GPT-4.5被DeepSeek 500倍吊打！基准测试全班垫底，OpenAI痛失护城河

OpenAI自爆：GPT-4.5 并非前沿模型！奥特曼称OpenAI的GPU已用光，还透露了一个“转型”思路？

GPT-4.5发布：价格飙升30倍 能力提升引发热议

OpenAI 发布 GPT-4.5：迄今最强大模型亮相 强化推理与情感智能

OpenAI正式发布GPT-4.5 率先向ChatGPT Pro用户开放

腾讯混元新一代快思考模型 Turbo S 发布 即将在腾讯元宝中上线

DeepSeek今日连开3源！针对优化的并行策略，梁文锋本人参与开发

DeepSeek开源三箭齐发，梁文峰亲自上阵！双向并行LLM训练飙升

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

曝GPT-4.5本周空降！1T激活参数，120T训练数据，会吐出阶段性思考成果然后继续思考

OpenAI Deep Research已向所有付费用户开放，系统卡发布

ScaleOT框架亮相AAAI 2025：提升隐私保护50%，降算力成本90%

幻方量化回应DeepSeek-R2模型提前发布：以官方消息为准

DeepSeek开放平台API充值服务已正式恢复

微软急刹车，被曝撤掉大波数据中心租赁！DeepSeek冲击，算力泡沫要破？

苹果计划将谷歌Gemini引入iOS：iOS 18.4测试版泄露第三方AI模型选项

双擎升级！商汤大装置DeepSeek企业版上线+免费版扩容

DeepSeek 开源周首日：开源 FlashMLA，AI 推理速度再进化！

GPT-4.5发布：价格飙升30倍能力提升引发热议

OpenAI 发布 GPT-4.5：迄今最强大模型亮相强化推理与情感智能

腾讯混元新一代快思考模型 Turbo S 发布即将在腾讯元宝中上线