历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月

开源 AI 世界的里程碑事件! 我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。 截至本周五下午两点,DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万,超越了同平台中 OpenAI 最热门项目。

我们正在见证历史:DeepSeek 项目在 GitHub 上的 Star 量超过了 OpenAI。

截至本周五下午两点,DeepSeek-V3 的 Star 量已达 7.77 万,超越 OpenAI 最热门项目。

DeepSeek 星数增长

DeepSeek-V3:性能标杆的 MoE 大模型

2023 年 12 月 26 日,DeepSeek AI 发布了其最新的 MoE(混合专家)大语言模型 DeepSeek-V3,成为开源 AI 领域的新标杆,引发全球热议。

该模型采用动态注意力机制(Dynamic Attention Mechanism),有效优化文本生成质量。其 6710 亿参数的 MoE 架构仅激活 370 亿参数,大幅降低计算成本。

训练成本仅为同类闭源模型的 1/20,总计花费 278.8 万 H800 GPU 小时(训练成本 557.6 万美元),远低于 Llama 3 的 3930 万 H100 GPU 小时。

DeepSeek V3 训练成本对比

DeepSeek-R1:强化学习驱动 AI 革命

2024 年 1 月 23 日,DeepSeek 在 V3 的基础上,结合强化学习(Reinforcement Learning),发布了 DeepSeek-R1,彻底改变了 AI 研究方向。

DeepSeek R1 性能媲美 OpenAI o1,且无需大量监督微调,仅靠强化学习就能赋予 LLM 强推理能力,引起 AI 业界广泛关注。

DeepSeek-R1 强化学习模型

DeepSeek 生态扩展:云平台纷纷接入

虽然 OpenAI 未开源其最新基础模型,目前其热门项目仍是 Whisper 语音识别和 openai-cookbook。

其他开源大模型 Star 数对比:

  • Llama 最高 5.75 万 Star
  • 阿里云 Qwen2.5:1.49 万 Star
  • 零一万物 Yi:7800 Star

开源大模型 Star 对比

全球 AI 生态的未来:DeepSeek 的影响

DeepSeek-V3 和 R1 促进了 AI 研究的新方向,尤其是强化学习方法 GRPO 的应用前景广受关注。

目前,DeepSeek 已被多家云服务提供商集成:

  • 国内:阿里云、华为云、腾讯云、百度智能云、360 数字安全等
  • 海外:英伟达、亚马逊、微软云服务

随着 DeepSeek 开源生态的扩大,我们或将见证生成式 AI 更快的发展!

相关资讯

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。

爆肝48小时!学会这8招,让DeepSeek变得超好用!

更多相关介绍:. 重磅好文! 8个章节带你全方位了解DeepSeek这两天,DeepSeek-R1 火的飞起,在中日美三个 Appstore 榜上登顶。