DeepSeek

国产大模型 DeepSeek-V3 开源：6710 亿参数自研 MoE，性能和 GPT-4o 不分伯仲

“深度求索”官方公众号昨日（12 月 26 日）发布博文，宣布上线并同步开源 DeepSeek-V3 模型，用户可以登录官网 chat.deepseek.com，与最新版 V3 模型对话。

12/27/2024 8:02:05 AM

故渊

雷军在线挖人，传年薪千万级！DeepSeek 关键骨干罗福莉已离职加入小米，或领军小米大模型团队；小米将在大模型上奋起直追！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）AI圈的大新闻，雷总在线挖人，小米要发力大模型了！知情人士称，雷军认为小米在大模型领域发力太晚，于是亲自挖人，重金招募能够领军小米大模型的人才，支付的薪酬水平在千万元级别。而且雷总已经初战告捷——帮小米赢得了DeepSeek的关键骨干罗福莉。

12/23/2024 12:33:42 PM

伊风

消息称雷军重金招募大模型领军人才，DeepSeek 罗福莉将加入小米

知情人士称，雷军认为小米在大模型领域发力太晚，于是亲自挖人，重金招募能够领军小米大模型的人才，支付的薪酬水平在千万元级别。（第一财经新皮层）

12/20/2024 10:48:21 PM

沛霖（实习）

DeepSeek-VL2 AI 视觉模型开源：支持动态分辨率、处理科研图表、解析各种梗图等

DeepSeek 官方公众号昨日（12 月 13 日）发布博文，宣布开源 DeepSeek-VL2 模型，在各项评测指标上均取得了极具优势的成绩，官方称其视觉模型正式迈入混合专家模型（Mixture of Experts，简称 MoE）时代。

12/14/2024 10:20:38 AM

故渊

DeepSeek V2 系列 AI 模型收官，联网搜索上线

DeepSeek 官方公众号昨日（12 月 10 日）发布博文，宣布 DeepSeek V2 系列收官，推出 DeepSeek V2.5 的最终版微调模型 DeepSeek-V2.5-1210，主要支持联网搜索功能，全面提升各项能力。

12/11/2024 11:53:59 AM

故渊

DeepSeek首发国产类o1模型！人人可以免费使用！

20日晚8点，DeepSeek在自己官方公众号上放出了一个大杀器：全新自研的DeepSeek-R1-Lite 预览版正式上线。据介绍，DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

11/25/2024 5:23:10 PM

DeepSeek 又出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶尖模型，有三项成绩还领先于 OpenAI o1-preview。

11/21/2024 1:20:00 PM

机器之心

推理模型 DeepSeek-R1-Lite 预览版上线，号称媲美 OpenAI o1-preview

官方表示，该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

11/20/2024 11:02:11 PM

沛霖（实习）

用60%成本干80%的事，DeepSeek分享沉淀多年的高性能深度学习架构

硬件发展速度跟不上 AI 需求，就需要精妙的架构和算法。根据摩尔定律，计算机的速度平均每两年就会翻一倍，但深度学习的发展速度还要更快，如图 1 和 2 所示。可以看到，AI 对算力的需求每年都以 10 倍幅度增长，而硬件速度每两年增长 3 倍、DRAM 带宽增长 1.6 倍、互连带宽则仅有 1.4 倍。而大模型是大数据大计算的产物，其参数量可达千亿乃至万亿规模，需要成千上万台 GPU 才能有效完成训练。这些实际情况提升了人们对高性能计算（HPC）的需求。为了获得更多计算资源，人们不得不扩展更多计算节点。这就导

9/6/2024 5:57:00 PM

机器之心

Deepseek AI 模型升级推出 2.5 版：合并 Coder 和 Chat，对齐人类偏好、优化写作任务和指令跟随等

DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型已经合并升级，升级后的新模型为 DeepSeek V2.5。图源：Linux.do 论坛网友截图DeepSeek 官方昨日（9 月 5 日）更新 API 支持文档，宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型，升级推出全新的 DeepSeek V2.5 新模型。官方表示为向前兼容，API 用户通过 deepseek-coder 或 deepseek-chat 均可以访问新的模型。新模型在

9/6/2024 8:37:33 AM

故渊

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

DeepSeek-Prover-V1.5 通过结合强化学习和蒙特卡洛树搜索，显著提升了证明生成的效率和准确性。AI 技术与数学发现的进展，正前所未有地交织在一起。前段时间，著名数学家陶哲轩在牛津数学公开讲座中做了主题为「AI 在科学和数学中的潜力」的主题分享。他指出，将 AI 整合到数学领域将使形式化证明的编写速度超过人类证明（人类证明容易出错）。这将成为一个关键转折点，意味着形式化证明的使用将不仅限于验证现有的证明，还将用于创造新的数学知识。这将通过广泛的人类数学家与 AI 数学家之间的协作来实现。我们将迎来一个

8/18/2024 3:09:00 PM

机器之心

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI 新规：组织想要用未来 AI 模型需先“验明正身”

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

DeepSeek

国产大模型 DeepSeek-V3 开源：6710 亿参数自研 MoE，性能和 GPT-4o 不分伯仲

雷军在线挖人，传年薪千万级！DeepSeek 关键骨干罗福莉已离职加入小米，或领军小米大模型团队；小米将在大模型上奋起直追！

消息称雷军重金招募大模型领军人才，DeepSeek 罗福莉将加入小米

DeepSeek-VL2 AI 视觉模型开源：支持动态分辨率、处理科研图表、解析各种梗图等

DeepSeek V2 系列 AI 模型收官，联网搜索上线

DeepSeek首发国产类o1模型！人人可以免费使用！

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

推理模型 DeepSeek-R1-Lite 预览版上线，号称媲美 OpenAI o1-preview

用60%成本干80%的事，DeepSeek分享沉淀多年的高性能深度学习架构

Deepseek AI 模型升级推出 2.5 版：合并 Coder 和 Chat，对齐人类偏好、优化写作任务和指令跟随等

DeepSeek开源数学大模型，高中、大学定理证明新SOTA