文章列表

分类

标签

DeepSeek R1范式复现笔记

作者 | yulei自DeepSeek R1技术报告🐳开放以来，开源社区涌现了多种「复现」工作。本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标，探索R1/R1-zero中强化学习步骤带来的模型效果提升，并尝试展望R1技术在未来模型训练与业务落地上的前景。一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。

2/20/2025 3:32:28 PM

腾讯技术工程

腾讯理财通升级AI能力:同时接入DeepSeek和混元大模型

腾讯理财通2月20日宣布重要升级:同时接入DeepSeek-R1模型满血版和腾讯混元大模型，标志着这家服务数亿用户的财富管理平台在AI金融服务领域迈出重要一步。本次升级后，腾讯理财通将整合其专业金融信息数据、微信公众号文章等资源，结合大模型能力，为用户提供更专业、实时的金融服务。用户可通过App首页搜索框或股票行情入口快速体验新功能。

2/20/2025 3:11:00 PM

AI在线

DeepSeek创始人是谁？这个问题DeepSeek也整不会了！

梁文锋到底有多低调？你问DeepSeek官网，连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。事情是这样的。

2/20/2025 2:54:56 PM

DeepSeek相关人士已辟谣：融资消息均为谣言阿里股价微跌0.88%

出品 | 51CTO技术栈（微信号：blog51cto）针对外媒称“DeepSeek 首次考虑筹集外部资金”的消息，DeepSeek相关人士今天上午已经进行了辟谣——融资消息均为谣言。（图1）但作为另一主角的阿里，尚无回应。腾讯科技报道，阿里美股股价微跌0.88%。

2/20/2025 2:30:31 PM

在近期于班加罗尔举办的 “投资卡纳塔克2025” 会议上，众多科技行业的领导者聚集一堂，探讨人工智能在印度的变革潜力及其影响。谷歌DeepMind的高级董事马尼什・古普塔（Manish Gupta）在会上发表了重要讲话，强调在推动技术创新的同时，应建立相应的规章制度，以确保负责任的发展。图源备注：图片由AI生成，图片授权服务商Midjourney古普塔指出，随着印度在构建基础性人工智能模型方面取得显著进展，大家都在关注人工智能对就业市场的影响。

2/20/2025 2:20:00 PM

AI在线

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

仅需简单提示，满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度，大幅提升上下文学习性能，突破少样本学习上限。图片大语言模型使用多步推理解决复杂数学问题，即先将复杂问题分解为多个步骤并逐步进行推理。

2/20/2025 12:09:22 PM

OpenAI的GPT-5即将问世：目前我们所知道的一切

想象一下，一个能浏览互联网、理解世界、记忆事物，还能像人一样自然聊天并进行复杂推理的AI。这听起来像科幻电影里的情节，但实际上，这样的技术已经离我们不远了。随着ChatGPT的不断进化，其最新版本GPT-5即将横空出世，预示着AI正朝着通用智能的目标大步迈进。

2/20/2025 11:20:41 AM

Bernard Marr

新突破！中国电信复现DeepSeek R1，探索行业大模型建设新路径

DeepSeek是由深度求索开发的低成本、高性能开源大语言模型，该模型通过强化学习与混合专家结构（MOE）的技术创新，以工程优化突破硬件限制，实现了“算力需求下降但性能提升”的反共识路径。开源策略重塑了AI生态，为全球开发者提供普惠工具，标志着从“算力堆砌”向“算法效率”的产业转型。中国电信政企信息服务事业群DeepSeek攻坚团队紧跟技术潮流，基于行业数据复现R1模型，提出行业大模型优化的新思路。

2/20/2025 11:12:11 AM

硅基流动袁进辉否认拒绝 DeepSeek 梁文锋投资，但承认自己没有远见感到后悔

大模型云服务商硅基流动于 2024 年底完成亿元人民币 Pre-A 轮融资。本月早些时候，硅基流动上线 DeepSeek R1 & V3 企业级服务，提供专属实例、算力纳管、私有版 MaaS、基于华为昇腾 910B 的一体机四种企业级服务模式供客户选择。

2/20/2025 10:57:42 AM

汪淼

Netflix 使用 AI 克隆被谋杀受害者声音引发公众愤怒

近日，Netflix 在其新推出的真实犯罪纪录片《美国谋杀:加比・佩蒂托》中，因使用 AI 技术重现已故社交媒体影响者加比・佩蒂托的声音而引发了广泛争议。加比于2021年8月被其未婚夫布莱恩・劳德里谋杀，令公众深感痛心。在纪录片开头，观众注意到了一则提示，称佩蒂托的日记和短信将通过语音重现技术以她的声音进行演绎。

2/20/2025 10:05:00 AM

AI在线

Mistral的AI助手Le Chat两周内下载量突破百万

在人工智能领域，Mistral 最近发布的 AI 助手 Le Chat 引起了广泛关注。仅仅在上线两周后，该应用便达成了令人瞩目的成就 —— 下载量突破了100万次。这一成果不仅在其发源地法国引发热潮，更在 iOS 应用商店中迅速攀升至免费应用下载榜首。

2/20/2025 10:04:00 AM

AI在线

DeepSeek否认融资传闻知情人士称"信息不实"

2024年2月20日，针对市场流传的"AI公司DeepSeek正筹备首次公开融资"消息，《科创板日报》报道，相关传闻均为不实信息，"融资事宜纯属谣言"。近期，随着生成式AI赛道持续升温，多家中国AI初创企业频传融资动态。月之暗面、Minimax等公司接连传出超10亿美元估值融资消息，引发市场对AI领域投资动向的高度关注。

2/20/2025 10:00:30 AM

AI在线

全球动画第一！AI哪吒走秀引百万网友围观，我们用DeepSeek搞了个

AI好好用报道编辑：杨文哪吒、敖闰、申公豹、太乙真人「走」上巴黎时装秀。小哪吒创造了传奇。不仅 16 天破百亿，刷新了中国影史纪录，现如今还直接干到了全球动画电影票房榜第一。

2/20/2025 9:31:00 AM

AI好好用

从大模型性能优化到DeepSeek部署

一、背景Deepseek-r1模型的爆火标志着本地部署大模型的需求日益增长。本文主要探讨如何优化本地部署大模型的性能，并结合我们的实践进行评测分析，文章最后我们将分享如何在本地高效部署满血版Deepseek-r1大模型。在生产环境中，我们已部署专用的大模型推理集群，并对其性能进行了全面优化。

2/20/2025 9:27:46 AM

menglinggong

多地政务服务系统接入DeepSeek大模型服务效率大提升

随着人工智能技术的迅速发展，越来越多的地方政府开始将 AI 引入政务服务，试图通过智能化手段提升服务质量和效率。近期，北京经济技术开发区和深圳福田区纷纷上线了基于 DeepSeek 大模型的智能政务助手，标志着 AI 在政务领域的应用迈出了重要一步。在北京经济技术开发区，新的智能政务小助手经过多家企业的测试后正式投入使用。

2/20/2025 9:23:00 AM

AI在线

谷歌将Gemini从iOS主应用撤出，押注独立应用战略

谷歌日前宣布一项重大战略调整:将其人工智能助手Gemini从iOS版谷歌主应用中完全移除，转而推广其独立应用。这一决策意在加强与ChatGPT、Claude等竞争对手的直接较量，但同时也面临着用户流失的风险。据悉，谷歌已通过电子邮件向用户发出通知，明确表示"Gemini不再在谷歌应用中可用"。

2/20/2025 9:13:00 AM

AI在线

腾讯深度思考模型「混元T1」面向所有用户开放

腾讯宣布其深度思考模型“混元T1”正式面向所有用户开放，用户可以通过腾讯元宝平台体验并测试该模型。此前，混元T1开启灰度测试后，受到了用户的广泛关注和积极反馈。为了满足用户需求，腾讯紧急部署，现已实现混元T1的全面开放，所有用户均可无限量使用。

2/20/2025 8:51:00 AM

AI在线

DeepSeek 被曝首次考虑进行外部融资，巨头阿里巴巴有意参投

外媒 The Information 报道提到，由于其 AI 模型大受欢迎，因而要增加资源投放以满足明显增加的需求，所以促成内部讨论引入更多投资者。

2/20/2025 1:26:23 AM

汪淼

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体 AI视频用哪个？6个知名的AI视频工具使用测评报告韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 OpenAI发布GPT-4.1指令提示工程指南

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 人形机器人百度 AI视频苹果深度学习模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练

文章列表

DeepSeek R1范式复现笔记

腾讯理财通升级AI能力:同时接入DeepSeek和混元大模型

DeepSeek创始人是谁？这个问题DeepSeek也整不会了！

DeepSeek相关人士已辟谣：融资消息均为谣言 阿里股价微跌0.88%

​谷歌DeepMind高管：AI 应助力人类能力，而非取代

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

OpenAI的GPT-5即将问世：目前我们所知道的一切

新突破！中国电信复现DeepSeek R1，探索行业大模型建设新路径

硅基流动袁进辉否认拒绝 DeepSeek 梁文锋投资，但承认自己没有远见感到后悔

​Netflix 使用 AI 克隆被谋杀受害者声音引发公众愤怒

Mistral的AI助手Le Chat两周内下载量突破百万

DeepSeek否认融资传闻 知情人士称"信息不实"

全球动画第一！AI哪吒走秀引百万网友围观，我们用DeepSeek搞了个

从大模型性能优化到DeepSeek部署

多地政务服务系统接入DeepSeek大模型 服务效率大提升

谷歌将Gemini从iOS主应用撤出，押注独立应用战略

腾讯深度思考模型「混元T1」面向所有用户开放

DeepSeek 被曝首次考虑进行外部融资，巨头阿里巴巴有意参投

DeepSeek相关人士已辟谣：融资消息均为谣言阿里股价微跌0.88%

谷歌DeepMind高管：AI 应助力人类能力，而非取代

Netflix 使用 AI 克隆被谋杀受害者声音引发公众愤怒

DeepSeek否认融资传闻知情人士称"信息不实"

多地政务服务系统接入DeepSeek大模型服务效率大提升