大模型六小强如何在 DeepSeek 冲击下重塑策略?

在过去的一个月里,全球大模型市场因 DeepSeek 的发布而陷入了动荡,各大公司纷纷被问及对这一新兴力量的看法与应对策略。 在国内市场上,已经成为独角兽的六家大模型创业公司 —— 零一万物、百川智能、阶跃星辰、智谱华章、月之暗面及 MiniMax,面临着严峻挑战,但各自的应对策略显示出不同的方向。 首先,零一万物的创始人李开复早前就表示,他们不再追求超级大模型的训练,而是专注于轻量化模型的开发。

在过去的一个月里,全球大模型市场因 DeepSeek 的发布而陷入了动荡,各大公司纷纷被问及对这一新兴力量的看法与应对策略。在国内市场上,已经成为独角兽的六家大模型创业公司 —— 零一万物、百川智能、阶跃星辰、智谱华章、月之暗面及 MiniMax,面临着严峻挑战,但各自的应对策略显示出不同的方向。

首先,零一万物的创始人李开复早前就表示,他们不再追求超级大模型的训练,而是专注于轻量化模型的开发。2月14日,零一万物与苏州高新区联合成立产业大模型基地,聚焦于制造、金融、医疗等多个领域,致力于将大模型技术从实验室推向实际应用。

DeepSeek

图源备注:图片由AI生成,图片授权服务商Midjourney

而在 DeepSeek 发布后的短短几天内,百川智能推出了全场景推理大模型 Baichuan-M1-preview,具备语言、视觉和搜索三大领域的能力,并重点向医疗行业转型,推出了 “AI 儿科医生” 项目,显示出其在实际应用中的迅速落地。

阶跃星辰则选择在 DeepSeek 发布当天推出两款新模型,提升自身的市场竞争力。此外,旗下的应用 “跃问” 也推出了全新功能,旨在帮助用户无代码开发应用,进一步提升用户体验。

智谱华章的创始人唐杰在国际峰会上强调,未来的大型语言模型将成为日常生活和工作的核心,通过自主学习与人类协作完成复杂任务,展现出其对未来的远见。

月之暗面则在 DeepSeek 发布后不久,推出了 Kimi k1.5多模态思考模型,以提升模型的上下文理解能力和策略优化,表明其在技术创新上的持续努力。

这六家创业公司虽然未直接对 DeepSeek 作出回应,但其实际行动和产品创新已经在积极应对这一冲击,并展现出适应市场变化的能力。

相关资讯

零一万物 API 上线,用户反馈多模态中文能力超过 GPT-4V

零一万物由创新工场董事长兼首席执行官李开复创办于 2023 年 6 月,六个月后,零一万物便成功发布了 Yi 系列模型,包含 6B 和 34B 两个版本,并开源,打破了当时国产开源模型一直难以超过 14B 的现状。 34B也是黄金尺寸的模型,既达到了大模型“涌现”能力的门槛,同时也能在消费级显卡上训练,对开发者相对友好。 此后较长一段时间 Yi-34B 在 Hugging Face 英文开源社区平台跻身前列,一举打响了零一万物的模型名声。

李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业务,关停部分项目

零一万物回复称:零一万物去年有一个多亿的收入,今年会有快速增长。零一万物不仅在不断上线更多的应用发掘价值,这个过程中,零一万物也会根据市场 PMF 对项目进行快速调整,包括加强投资部分业务、鼓励有商业化潜力的项目进行独立融资,也包括关停部分项目。

李开复官宣「全球最强」开源大模型:一次处理40万汉字、中英均霸榜

李开复表示,「零一万物要跻身全球大模型第一梯队。」开源大模型宇宙又有了新的重量级成员,这次是创新工场董事长兼 CE0 李开复大模型公司「零一万物」推出的「Yi」系列开源大模型。据悉,零一万物在今年 3 月底官宣成立,六七月开始运营,李开复博士为创始人兼 CEO。11 月 6 日,零一万物正式发布「Yi」系列预训练开源大模型,包括了 Yi-6B 和 Yi-34B 两个版本,给了开源大模型社区「一点小小的震撼」。根据 Hugging Face 英文开源社区平台和 C-Eval 中文评测的最新榜单,Yi-34B 预训练模