DeepSeek

DeepSeek R1范式复现笔记

作者 | yulei自DeepSeek R1技术报告🐳开放以来，开源社区涌现了多种「复现」工作。本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标，探索R1/R1-zero中强化学习步骤带来的模型效果提升，并尝试展望R1技术在未来模型训练与业务落地上的前景。一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。

DeepSeek创始人是谁？这个问题DeepSeek也整不会了！

梁文锋到底有多低调？你问DeepSeek官网，连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。事情是这样的。

DeepSeek相关人士已辟谣：融资消息均为谣言阿里股价微跌0.88%

出品 | 51CTO技术栈（微信号：blog51cto）针对外媒称“DeepSeek 首次考虑筹集外部资金”的消息，DeepSeek相关人士今天上午已经进行了辟谣——融资消息均为谣言。（图1）但作为另一主角的阿里，尚无回应。腾讯科技报道，阿里美股股价微跌0.88%。

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

仅需简单提示，满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度，大幅提升上下文学习性能，突破少样本学习上限。图片大语言模型使用多步推理解决复杂数学问题，即先将复杂问题分解为多个步骤并逐步进行推理。

新突破！中国电信复现DeepSeek R1，探索行业大模型建设新路径

DeepSeek是由深度求索开发的低成本、高性能开源大语言模型，该模型通过强化学习与混合专家结构（MOE）的技术创新，以工程优化突破硬件限制，实现了“算力需求下降但性能提升”的反共识路径。开源策略重塑了AI生态，为全球开发者提供普惠工具，标志着从“算力堆砌”向“算法效率”的产业转型。中国电信政企信息服务事业群DeepSeek攻坚团队紧跟技术潮流，基于行业数据复现R1模型，提出行业大模型优化的新思路。

硅基流动袁进辉否认拒绝 DeepSeek 梁文锋投资，但承认自己没有远见感到后悔

大模型云服务商硅基流动于 2024 年底完成亿元人民币 Pre-A 轮融资。本月早些时候，硅基流动上线 DeepSeek R1 & V3 企业级服务，提供专属实例、算力纳管、私有版 MaaS、基于华为昇腾 910B 的一体机四种企业级服务模式供客户选择。

DeepSeek否认融资传闻知情人士称"信息不实"

2024年2月20日，针对市场流传的"AI公司DeepSeek正筹备首次公开融资"消息，《科创板日报》报道，相关传闻均为不实信息，"融资事宜纯属谣言"。近期，随着生成式AI赛道持续升温，多家中国AI初创企业频传融资动态。月之暗面、Minimax等公司接连传出超10亿美元估值融资消息，引发市场对AI领域投资动向的高度关注。

全球动画第一！AI哪吒走秀引百万网友围观，我们用DeepSeek搞了个

AI好好用报道编辑：杨文哪吒、敖闰、申公豹、太乙真人「走」上巴黎时装秀。小哪吒创造了传奇。不仅 16 天破百亿，刷新了中国影史纪录，现如今还直接干到了全球动画电影票房榜第一。

从大模型性能优化到DeepSeek部署

一、背景Deepseek-r1模型的爆火标志着本地部署大模型的需求日益增长。本文主要探讨如何优化本地部署大模型的性能，并结合我们的实践进行评测分析，文章最后我们将分享如何在本地高效部署满血版Deepseek-r1大模型。在生产环境中，我们已部署专用的大模型推理集群，并对其性能进行了全面优化。

多地政务服务系统接入DeepSeek大模型服务效率大提升

随着人工智能技术的迅速发展，越来越多的地方政府开始将 AI 引入政务服务，试图通过智能化手段提升服务质量和效率。近期，北京经济技术开发区和深圳福田区纷纷上线了基于 DeepSeek 大模型的智能政务助手，标志着 AI 在政务领域的应用迈出了重要一步。在北京经济技术开发区，新的智能政务小助手经过多家企业的测试后正式投入使用。

DeepSeek 被曝首次考虑进行外部融资，巨头阿里巴巴有意参投

外媒 The Information 报道提到，由于其 AI 模型大受欢迎，因而要增加资源投放以满足明显增加的需求，所以促成内部讨论引入更多投资者。

DeepSeek服务器繁忙？实测30个接入平台，28个快速直达！

一、现象级表现. DeepSeek 自发布以来，热度直逼两年前 ChatGPT 横空出世的时候。英伟达、亚马逊、微软等巨头率先接入，国内厂商也迅速跟进。

DeepSeek公务员上岗！公务员铁饭碗不保？

图片2月18日，“AI公务员上岗”冲上热搜第一名，在深圳福田区率先推出基于DeepSeek开发的AI数字员工，首批70名上岗。这一事件标志着智能体技术从实验室走向社会治理的第一线，开启人机协作的新纪元。据介绍，福田这70名新员工可实现:公文格式修正准确率超 95%，审核时间缩短90%错误率控制在 5%以内;“执法文书生成助手”将执法笔录秒级生成执法文书初稿;民生诉求分拨准确率从70%提升至95%;“AI招商助手”企业分析筛选效率提升 30%……“幸福福田”官微显示，广东深圳福田区推出基于DeepSeek开发的AI数智员工，上线福田区政务大模型2.0版，除了有DeepSeek通用能力外，还结合各部门各单位实际业务流程，量身定制个性化智能体，首批满足240个业务场景使用。

DeepSeek R1范式复现笔记

DeepSeek创始人是谁？这个问题DeepSeek也整不会了！

DeepSeek相关人士已辟谣：融资消息均为谣言阿里股价微跌0.88%

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

新突破！中国电信复现DeepSeek R1，探索行业大模型建设新路径

硅基流动袁进辉否认拒绝 DeepSeek 梁文锋投资，但承认自己没有远见感到后悔

DeepSeek否认融资传闻知情人士称"信息不实"

全球动画第一！AI哪吒走秀引百万网友围观，我们用DeepSeek搞了个

从大模型性能优化到DeepSeek部署

多地政务服务系统接入DeepSeek大模型服务效率大提升

DeepSeek 被曝首次考虑进行外部融资，巨头阿里巴巴有意参投

DeepSeek服务器繁忙？实测30个接入平台，28个快速直达！

DeepSeek公务员上岗！公务员铁饭碗不保？

DeepSeek 清华原版宝典：工作、学习、生活、科研中的难题，轻松搞定

理想同学 App 接入 DeepSeek R1 满血版

DeepSeek新注意力机制引热议！梁文锋亲自提交预印本，目标明确降低计算成本

李彦宏最新财报会议内容流出：百度从DeepSeek身上学到了一件事；调用量涨30倍百度AI搜索的打法；50亿股票回购回馈股东

Spring Boot 接入 DeepSeek API：实现智能应用的全新路径

DeepSeek

DeepSeek R1范式复现笔记

DeepSeek创始人是谁？这个问题DeepSeek也整不会了！

DeepSeek相关人士已辟谣：融资消息均为谣言 阿里股价微跌0.88%

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

新突破！中国电信复现DeepSeek R1，探索行业大模型建设新路径

硅基流动袁进辉否认拒绝 DeepSeek 梁文锋投资，但承认自己没有远见感到后悔

DeepSeek否认融资传闻 知情人士称"信息不实"

全球动画第一！AI哪吒走秀引百万网友围观，我们用DeepSeek搞了个

从大模型性能优化到DeepSeek部署

多地政务服务系统接入DeepSeek大模型 服务效率大提升

DeepSeek 被曝首次考虑进行外部融资，巨头阿里巴巴有意参投

DeepSeek服务器繁忙？实测30个接入平台，28个快速直达！

DeepSeek公务员上岗！公务员铁饭碗不保？

DeepSeek 清华原版宝典：工作、学习、生活、科研中的难题，轻松搞定

理想同学 App 接入 DeepSeek R1 满血版

DeepSeek新注意力机制引热议！梁文锋亲自提交预印本，目标明确降低计算成本

李彦宏最新财报会议内容流出：百度从DeepSeek身上学到了一件事；调用量涨30倍百度AI搜索的打法；50亿股票回购回馈股东

Spring Boot 接入 DeepSeek API：实现智能应用的全新路径

DeepSeek相关人士已辟谣：融资消息均为谣言阿里股价微跌0.88%

DeepSeek否认融资传闻知情人士称"信息不实"

多地政务服务系统接入DeepSeek大模型服务效率大提升