月之暗面因 DeepSeek 调整工作重心?内部人士:强化学习或许会是个方向

2 月 15 日下午消息,据媒体报道,月之暗面内部已经将“持续拿到 SOTA 结果”确定为当下最重要的工作目标。2025 年,月之暗面围绕模型能力的关键方向除了继续强化多模态部分外,还会继续强化长文本推理能力。

2 月 15 日下午消息,据媒体报道,月之暗面内部已经将“持续拿到 SOTA 结果”确定为当下最重要的工作目标。2025 年,月之暗面围绕模型能力的关键方向除了继续强化多模态部分外,还会继续强化长文本推理能力。

报道分析称,DeepSeek 爆火后,DeepSeek 与月之暗面存在的路线差异,让外界面临重新审视月之暗面技术模式、用户增长模式的情况。其中,月之暗面闭源,坚持预训练(需要大量卡和算力资源),且不把蒸馏技术作为关键,在 C 端市场通过大量投流实现拉新;而 DeepSeek 则是开源,虽然也采取预训练,但把蒸馏技术作为关键手段大幅度节省成本,在 C 端市场并未投流。

而今,DeepSeek 采用区别与月之暗面的路线,也取得了现阶段更为出色的效果。业内人士认为,月之暗面如果想守住生态位,“需要做一些改变或者尝试,比如开源,比如调整引流策略等。”不过目前,月之暗面尚未明确是否“接入”DeepSeek,对于接下来是否“开源”,公司也未置评媒体问询。

对于月之暗面是否会因 DeepSeek 而调整工作重心一事,新浪科技向月之暗面方面求证,截止发稿公司暂无回应。不过有内部人士透露称,“RL(强化学习)大概率会是一个(工作重点)方向”。

作为此次 DeepSeek 出圈后最受关注的热门技术话题,DeepSeek 通过大规模强化学习技术得到比肩 OpenAI o1 能力的 DeepSeek-R1-Zero,令业界倍感兴奋。新浪科技了解到,去年 11 月份月之暗面宣布推出新一代数学推理模型 k0-math 之际,Kimi 探索版便通过运用强化学习技术创新了搜索体验,在意图增强、信源分析和链式思考三大推理能力上实现突破。彼时,月之暗面 Kimi 创始人杨植麟便对强化学习这一技术路线带来的模型能力提升给予了高度评价。

而在近日 OpenAI 发布关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》中,论文也特别提到,“中国的 DeepSeek-R1 和 Kimi k1.5 通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。其中 k1.5 便是 DeepSeek 和 Kimi 在 1 月 20 日同时发布的新型推理模型。”

相关资讯

推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术

2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧! ”一时间,Kimi k1.5 成了话题王者。 但在一个月后的 2 月 24 日,X 上出现了一篇关于 Kimi k1.5 的技术爆料帖,博主直言 k1.5 所用到的强化学习算法,其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。

消息称 Kimi 大砍投放预算,DeepSeek 冲击之下月之暗面暂缓“烧钱”投广告

月之暗面近期决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。(界面新闻)

Kimi大幅削减广告预算,DeepSeek崛起令月之暗面压力倍增

在国内 AI 领域,Kimi 曾是备受关注的创业产品,但随着 DeepSeek 的崛起,这一局面正悄然改变。 近日,月之暗面公司宣布将大幅削减 Kimi 的广告投放预算,暂停多个安卓渠道的推广以及与第三方广告平台的合作,这一决策显然是对 DeepSeek 迅猛发展的直接反应。 根据界面新闻的报道,DeepSeek 在短短数十天内成功吸引了3500万日活跃用户,而 Kimi 在过去一年多的时间内投入大量资金,日活跃用户却未能突破千万。