推理模型 - AIGC宇宙

阿里开源推理模型QwQ-32B，性能比肩R1满血版！

Manus 发布之后，随之而来赶到战场的，是阿里。关于 Manus 的深度测评：. 一手体验首款通用Agent产品Manus昨天夜里，深夜惊雷。

32B逆袭671BDeepSeek R1！阿里推理模型炸翻了：小到笔记本就能run,成本仅1/10！又是强化学习带来惊喜！

编辑 | 伊风太震撼了。阿里直接扔了一张王炸！ QwQ-32B，一个参数量如此小的小模型，居然追平了671B的DeepSeek-R1？

业界首个“混合AI推理模型”！快OpenAI一步Anthropic跳版本发布：Claude3.7 Sonnet可自行决定思考时长

整理 | 星璇出品 | 51CTO技术栈（微信号：blog51cto）就在OpenAI还在吊胃口之际，最强竞对 Anthropic 深夜开大了！ Anthropic 直接把自家的“通用推理”二合一的模型发布了，并把自家内部在用的AI编程工具也上线，直接可以终端执行任务的那种！这就带大家看看这家公司在大模型以及AI产品上的不同打法！

1/30 训练步骤复刻 DeepSeek-R1-Zero，沈向洋姜大昕张祥雨等开源推理模型 RL 训练方法

现在，开源 RL 训练方法只需要用 1/30 的训练步骤就能赶上相同尺寸的 DeepSeek-R1-Zero 蒸馏 Qwen。

Sebastian Raschka：关于DeepSeek R1和推理模型，我有几点看法

著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次，他将立足于 DeepSeek 技术报告，介绍用于构建推理模型的四种主要方法，也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示：「我希望这能提供有价值的见解，并帮助你了解围绕这一主题的快速演变的文献和话题炒作。

外国专家解读DeepSeek：预算有限，如何复制R1推理模型？纯强化学习不现实！不是任何问题都得问DeepSeek！

出品 | 51CTO技术栈（微信号：blog51cto）Sebastian Raschka是一位外国知名的AI专家。特别在大型语言模型（LLM）研究方面，有着丰富的研究经验。近日DeepSeek-R1推理模型的推出，将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能，而且所需的成本和算力都大大降低。

应对DeepSeek挑战，OpenAI增加o3-mini公开推理过程

OpenAI近日宣布展示其最新推理模型o3-mini的详细推理过程，此举被视为对竞争对手DeepSeek-R1日益增长压力的回应。这一改变标志着OpenAI在模型透明度策略上的重要转变。此前，OpenAI一直将"思维链"（Chain of Thought， CoT）视为核心竞争优势而选择隐藏。

网易有道全面拥抱DeepSeek-R1，加速AI教育应用商业化落地

1月20日，DeepSeek震撼发布DeepSeek-R1，这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力，同时实现了API调用成本90%-95%的大幅缩减，无疑为科技界投下了一颗开年“重磅炸弹”。 DeepSeek-R1的深度推理能力不仅为AI产业的多元化发展开辟了新航道，也为包括教育在内的多个行业带来了革新动力。作为教育科技企业，网易有道坚持深入挖掘教育场景下的大模型应用价值。

有道子曰推理模型“子曰-o1”发布即开源，14B小参数复现OpenAI o1强推理效果

2025开年，AI行业掀起大模型“推理潮”，自OpenAI发布o1后，各式推理模型不断涌现，模型的高阶推理能力迎来爆发增强，其应用价值也愈发获得业界的广泛关注。 1月22日，网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。作为14B轻量级单模型，子曰-o1支持在消费级显卡上进行部署，采用思维链技术，能够提供细致解题过程，以强逻辑和推理能力，实现更高的解题准确性，并提供中文逻辑推理。