模型 - AIGC宇宙

GPT开山一作，本科学历入职前CTO初创！OpenAI痛失「爱因斯坦级天才」

被Ilya感谢过，被奥特曼誉为「爱因斯坦级的天才」，在OpenAI更是「想要什么就给什么」——即便如此，去年12月，Alec Radford还是选择了离开。直到昨天，他的去向才确定。据Thinking Machine Lab官网更新，OpenAI前核心成员Alec Radford和Bob McGrew将担任公司顾问（Advisors）。

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。图片论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

OpenAI官方基准测试：承认Claude遥遥领先（狗头）

OpenAI承认Claude是最好的了（狗头）。刚刚开源的新基准测试PaperBench，6款前沿大模型驱动智能体PK复现AI顶会论文，新版Claude-3.5-Sonnet显著超越o1/r1排名第一。与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比，PaperBench更考验综合能力，不再是只执行单一任务。

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

虽然又被GPT-4o吉卜力生图的光芒掩盖了，但毫无疑问，上周的另一技术核弹Gemini 2.5 Pro，也是无可争议的强！在试用过程中，网友们逐渐发现，这个模型真的强到发指。在门萨Norway的IQ测试中，它已经突破了130。

OpenAI破大防，拒绝率从98%骤降2%！陈怡然团队提出全新思维链劫持攻击

随着通向通用人工智能（AGI）的进展，大语言模型正进化出复杂推理能力，衍生出所谓「大型推理模型」（Large Reasoning Models, LRMs）。 OpenAI 的o系列模型凭借接近人类的推理水准刷新了诸多基准，另一边新的模型DeepSeek-R1也以更低成本实现了与o系列相当的性能。这些模型不仅能逐步推理复杂问题，还开始将思维链（Chain-of-Thought, CoT）用于安全审查，在回答用户请求前通过内部推理判断内容是否违规，这种思路其实为平衡实用性和安全性提供了一个很有前景方向。

阿里通义千问 QwenQ-32B 上线中科院科研项目大规模接入

近日，阿里巴巴宣布其最新的开源大模型 —— 通义千问 QwenQ-32B，已在多个中科院科研项目中得到广泛应用。这一创新标志着人工智能在科研领域的进一步深入，尤其是在气候变化和水资源管理方面的潜力。中国科学院国家天文台、青藏高原研究所和南海海洋研究所等单位，均已开始利用 QwenQ-32B 进行科研项目。

一文看懂多模态思维链DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

DeepSeek V3升级了，新版本V3-0324。官方轻描淡写只说是“小版本升级”，但很多人实测下来可一点也不小。把流行的小球弹跳测试，提升难度到4维空间超立方体也没问题。

OpenAI史上最贵模型来了！比DeepSeek贵270倍，100万输出token 600美元

比DeepSeek-R1贵270倍，OpenAI史上最贵模型来了！就在刚刚，OpenAI上线了推理模型o1-pro的API。本来大家还挺高兴，结果一看到价格，悬着的心终于死了。

刚刚，OpenAI推出最贵o1-pro API！千倍于DeepSeek

刚刚，OpenAI 在其开发者 API 中推出了 o1 推理模型的一个更强大版本，即 o1-pro。据 OpenAI 称，o1-pro 使用比 o1 更多的计算资源来提供更好的响应。该功能仅对特定开发者开放（Tier 1–5 开发者），支持视觉、函数调用、结构化输出，并与响应和 Batch API 兼容。

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

皮衣老黄，带着最强AI芯片GB300闪亮登场“AI超级碗”GTC，燃爆全场！性能方面，和去年发布的GB200相比，推理性能是其1.5倍。据悉，GB300将在今年的下半年出货。

o1/o3后训练负责人离职创业，奥特曼把OpenAI玩成另一个YC孵化器了

OpenAI高管离职潮继续：CTO Mira卷着一票人才集体出走之后，刚刚，后训练研究副总裁William Fedus也官宣离职创业了。他在不到半年前，也就是去年10月刚刚晋升——没错，彼时OpenAI的上一任后训练负责人Barret Zoph等人刚刚跟着CTO Mira跑路。在那一拨人才离职潮中，William (Liam) Fedus是顶上重任的主要角色之一。

十个让DeepSeek变强大的指令模型

以下是10个AI指令万能公式及对比案例，涵盖不同场景下的应用技巧，帮助大家通过结构化指令提升AI输出质量：1. 角色定位法：明确AI的专家身份错误指令： "写一篇产品营销文案。 " （AI可能生成通用模板，缺乏针对性）正确公式：【角色】【任务】【场景】案例： "你是一位10年经验的数码产品营销专家，请为新品智能手表撰写一篇小红书文案，重点突出健康监测功能和商务场景适配性。

DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

号称地表最强的M3 Ultra，本地跑满血版DeepSeek R1，效果到底如何？其实，有些DeepSeek玩家们已经提前拿到手做过实测了。例如这位Alex老哥就是其中之一：他提前拿到了两台搭载M3 Ultra的Mac Studio，配置是这样的：M3 Ultra（32 核中央处理器、80 核图形处理器和 32 核神经网络引擎）512G统一内存1TB固态硬盘具体来说，Alex老哥用配备Thunderbolt 5互连技术（传输速率为 80Gbps）的EXO Labs设备，来运行完整的DeepSeek R1模型（671B、8-bit）。

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

模型

GPT开山一作，本科学历入职前CTO初创！OpenAI痛失「爱因斯坦级天才」

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

OpenAI官方基准测试：承认Claude遥遥领先（狗头）

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

OpenAI破大防，拒绝率从98%骤降2%！陈怡然团队提出全新思维链劫持攻击

阿里通义千问 QwenQ-32B 上线中科院科研项目大规模接入

一文看懂多模态思维链DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

OpenAI史上最贵模型来了！比DeepSeek贵270倍，100万输出token 600美元

刚刚，OpenAI推出最贵o1-pro API！千倍于DeepSeek

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

o1/o3后训练负责人离职创业，奥特曼把OpenAI玩成另一个YC孵化器了

十个让DeepSeek变强大的指令模型

DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

OpenAI深夜发布全新Agent工具：两大杀器登场，感觉可以手搓Manus了

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

另一个来自中国本土"DeepSeek"时刻？全球首个通用人工智能代理发布

模型

GPT开山一作，本科学历入职前CTO初创！OpenAI痛失「爱因斯坦级天才」

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！ 新智元 新智元 2025年04月04日 17:33

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

OpenAI官方基准测试：承认Claude遥遥领先（狗头）

刚刚，谷歌最强Gemini 2.5 Pro免费了！数学碾压人类研究生，拿下全球TOP 1

OpenAI破大防，拒绝率从98%骤降2%！陈怡然团队提出全新思维链劫持攻击

阿里通义千问 QwenQ-32B 上线 中科院科研项目大规模接入

一文看懂多模态思维链DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

OpenAI史上最贵模型来了！比DeepSeek贵270倍，100万输出token 600美元

刚刚，OpenAI推出最贵o1-pro API！千倍于DeepSeek

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

o1/o3后训练负责人离职创业，奥特曼把OpenAI玩成另一个YC孵化器了

十个让DeepSeek变强大的指令模型

DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

OpenAI深夜发布全新Agent工具：两大杀器登场，感觉可以手搓Manus了

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

另一个来自中国本土"DeepSeek"时刻？全球首个通用人工智能代理发布

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33

阿里通义千问 QwenQ-32B 上线中科院科研项目大规模接入