月之暗面发布 Kimi k1.5 多模态思考模型，实现 SOTA 级多模态推理能力

作者：清源

2025-01-20 10:26

官方表示，在 short-CoT 模式下，Kimi k1.5 的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude 3.5 Sonnet 的水平，领先达到 550%。

感谢月之暗面今日宣布推出 Kimi 全新 SOTA 模型 ——k1.5 多模态思考模型，其实现了 SOTA （state-of-the-art）级别的多模态推理和通用推理能力。

官方表示，在 short-CoT 模式下，Kimi k1.5 的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude 3.5 Sonnet 的水平，领先达到 550%。

在 long-CoT 模式下，Kimi k1.5 的数学、代码、多模态推理能力，也达到长思考 SOTA 模型 OpenAI o1 正式版的水平。

据介绍，k1.5 模型设计和训练存在长上下文扩展、改进的策略优化、简洁的框架、多模态能力等关键要素。该模型擅长深度推理，可以辅助“解锁更多更难的事情”，应对难解的代码问题、数学问题、工作问题。

AI在线注：k1.5 多模态思考模型的预览版将陆续灰度上线 Kimi.com 网站和最新版本的 Kimi 智能助手 App。

月之暗面发布 Kimi k1.5 多模态思考模型，实现 SOTA 级多模态推理能力

相关标签：

Kimi 月之暗面

相关资讯

推特热帖：k1.5 很牛，因为借鉴了 UCLA 与 CMU 合作团队的这项技术

推特热帖：k1.5 很牛，因为借鉴了 UCLA 与 CMU 合作团队的这项技术

2025 年 1 月 20 日 Kimi k1.5 正式发布，伴随着技术报告的公布，有网友表示：“这应该是全球范围内，除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧！ ”一时间，Kimi k1.5 成了话题王者。但在一个月后的 2 月 24 日，X 上出现了一篇关于 Kimi k1.5 的技术爆料帖，博主直言 k1.5 所用到的强化学习算法，其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。

月之暗面因 DeepSeek 调整工作重心？内部人士：强化学习或许会是个方向

月之暗面因 DeepSeek 调整工作重心？内部人士：强化学习或许会是个方向

2 月 15 日下午消息，据媒体报道，月之暗面内部已经将“持续拿到 SOTA 结果”确定为当下最重要的工作目标。2025 年，月之暗面围绕模型能力的关键方向除了继续强化多模态部分外，还会继续强化长文本推理能力。

月之暗面：一年前就验证过长思维链，因成本高先搞了长文本

月之暗面：一年前就验证过长思维链，因成本高先搞了长文本

月之暗面研究员 Flood Sung 近日分享了 k1.5 模型背后的完整思考过程，并透露称，2024 年 9 月 12 号 OpenAI o1 发布带来的震撼效果，令自己陷入了 Long-CoT 的有效性反思中。

资讯热榜

使用 VLLM 部署 DeepSeek：基于 Ubuntu 22.04 + RTX 4090 + Docker 的完整指南 Ollama的配置修改与接口调用一条神奇的指令，DeepSeek直接文生图最新版DeepSeek保姆喂饭级安装教程：本地部署+避坑指南（升级版） OpenAI突然发布智能体API！支持网络和文件搜索以及computer use 从DeepSeek MoE专家负载均衡谈起基于Dify与DeepSeek：零门槛训练自己的专属AI大模型 OpenAI深夜大招暴打Manus！智能体全家桶杀器一统API，4行代码轻松上手

标签云