DeepSeek

波士顿动力创始人自曝已购买宇树机器人，并称 DeepSeek 创新“只是开始”

“我们的实验室买了宇树的人形机器人，还买了几个小型的机器人，它们相对便宜。即便我们是竞争对手，我们也可以买来看看它究竟能做些什么。”

DeepSeek FlashMLA：大模型推理的“涡轮增压器”

FlashMLA（Flash Multi-head Latent Attention）是DeepSeek针对英伟达Hopper架构GPU（如H800/H100）设计的高效解码内核，其核心技术围绕多头潜在注意力（MLA）机制展开，通过软硬件协同优化实现性能突破

DeepSeek，2025 最值得学习十个 Vue3 库源码？

VueUse - 组合式API工具集GitHub: ，提供 200 组合式 API 函数。其模块化架构和TypeScript 类型系统堪称典范，适合学习如何组织大型工具类项目。源码中可重点研究 useStorage 的状态同步机制和 useEventListener 的事件管理设计2.

DeepSeek R1 满血版来了，完全不卡！

前言最近DeepSeek爆火。我之前也发过多篇关于DeepSeek的文章，推荐大家使用它。今年是AI的一个风口。

五分钟，构建国产数据库智能体

近期，圈里很多朋友，都尝试利用 DeepSeek 构建自己的智能体。我也利用腾讯元器，将个人公众号内容做了个智能体，可以实现简单的问答。那么延展来看，智能体除了可利用公众号内容，也可使用离线文件等方式来构建。

如何用DeepSeek轻松搞定复杂工作？实操手册来了！

在职场中，我们每天都要面对写报告、做汇报、申请专利这些耗时又烧脑的任务。明明知道这些工作很重要，却常常因为思路不清、效率低下而加班到深夜。在 DeepSeek出来之前，我其实也都在利用它帮我解决类似的这些问题，老读者应该都知道我写 AI 相关的教程是最快的，从 22 年 AI 还没那么火的时候，我就已经在写这些教程了。

兆芯全系列整机形态成功部署 DeepSeek R1 大模型

上海兆芯集成电路股份有限公司今日发文宣布：近日，基于兆芯高性能通用处理器的 PC 终端、工作站以及服务器成功实现 DeepSeek-R1-Distill 模型（1.5B / 7B / 32B / 70B / 671B 等）的本地部署。

2月24日，腾讯云智能数智人和腾讯企点客服正式宣布接入DeepSeek大模型，借助其卓越的语义理解和意图识别能力，进一步优化用户体验，提升服务质量和客户满意度。腾讯云智能数智人全面接入DeepSeek大模型后，用户无需开发即可通过数智人平台内置的V3、R1等模型，让DeepSeek拥有真人外观并实现自然流畅的交互。在交互场景中，数智人能够快速整合多源信息，提供精准解答，并支持多轮对话与上下文理解，广泛应用于政策问答、景区导览、展厅接待等场景。

双擎升级！商汤大装置DeepSeek企业版上线+免费版扩容

今年2月，商汤大装置万象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型，并为免费版提供3个月内千万Token额度，受到客户的热烈响应。为了更好的服务用户，经过系列优化，，现正式推出企业版，同时完成免费版国产化适配与算力扩容，形成专业强支撑普惠广覆盖的双擎驱动！登录官网，即刻体验！

腾讯元宝超越豆包登上苹果中国区APP免费榜第二 DeepSeek稳坐第一

近日，苹果中国区 APP 免费榜迎来了新的变化，腾讯的元宝应用一跃而起，超越豆包，跻身排行榜第二位。榜首的位置则被 DeepSeek 牢牢占据。这一现象不仅反映了市场竞争的激烈，也展示了国内大模型行业快速发展的势头。

月之暗面推出新优化器Muon，计算效率大幅提升

近日，人工智能领域再度掀起波澜，月之暗面（Moonshot）宣布开源新版优化器 Muon，成功将计算效率提升至传统 AdamW 的两倍。这个新优化器的推出恰逢 DeepSeek 即将连续开源多个代码库，引发了业内的高度关注和讨论。 Muon 优化器最初由 OpenAI 的研究者 Keller Jordan 等人在2024年提出，针对小规模模型训练时表现优异。

DeepSeek一夜把百度干回20年前，网友：还有这好事？

没完了，刚刚接入DeepSeek的百度，又双叒叕搞事情了。最新消息，“百度一下你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan，回归了。有意思的是，这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。

多行业拥抱DeepSeek，全不顾它身上的“刺”

在数字化浪潮席卷全球的今天，技术革命的脚步正以指数级速率重构人类社会发展轨迹。而DeepSeek的出现，毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付，从医疗影像的毫厘级诊断到教育资源的跨时空共享，算法与数据的交织已然突破想象力的边界。当下，众多产业正在与人工智能产生"化学反应"，这种由技术创新引发的链式反应，正在三百六十度解构既有行业秩序，催生出"生产力跃迁2.0"时代的全新商业生态。

梁文锋亲自挂名，DeepSeek 最新论文丢出注意力新机制，推理速度直线提升 11 倍

2 月 18 日，马斯克发布 Grok 3 的热度还没过去，梁文锋就作为 co-authors 带着 DeepSeek 研究团队杀了回来。公布新研究的推文发布不到 3 个小时，就带来了三十多万的浏览量，火爆程度不逊 OpenAI。而这次 DeepSeek 团队最新的研究论文更是重磅，论文中介绍了一种全新的，可用于超快速的长上下文训练与推理的注意力机制 —— NSA，值得一提的是，NSA 还具有与硬件对齐的特点，十足的硬件友好。

腾讯健康接入DeepSeek+腾讯混元双模型升级就医体验

2月24日，腾讯健康宣布通过腾讯云全面接入DeepSeek大模型，并与腾讯自研的混元大模型“双核组队”，全面升级医疗服务，涵盖智能导诊、预问诊、健康问答、智能用药、症状自查、影像报告解读及质控等多个场景。这一升级旨在帮助全国超过1000家医院快速提升智能应用水平，并为医疗机构、体检中心、药械企业和基因测序企业提供多模型部署及应用方案。此次升级围绕就医全流程展开，从诊前的健康问答、症状自查和智能导诊，到诊中的智能预问诊，再到诊后的报告解读和智能用药，腾讯健康正逐步将服务切换至“多模型”模式。

DeepSeek开源周“第一刀”砍向算力！重磅开源FlashMLA，挑战H800算力极限，网友直呼：极致的工程设计！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）上周五，DeepSeek刚刚预告了重磅开源周！周一一早，DeepSeek就履行承诺，开源了针对 Hopper GPU 的高效 MLA 解码内核——FlashMLA！图片根据DeepSeek介绍，FlashMLA内核针对变长序列进行了优化，是已投入生产的核心技术。

从理论到实践：学会如何商用 DeepSeek，收藏这一篇就够了

Hi，大家好，我叫秋水，当前专注于 AI Agent 和 AI 工作流自动化。近期 DeepSeek，全球闻名，大家纷纷在讨论，我看过很多文章和视频，很多说的有点夸张，23 年 AI 刚来的那些内容，又重新说了一遍，只是把 AI 两个字母换成了 DeepSeek。在我看来，DeepSeek 出圈的主要原因是能力强、价格低、开源、可以本地部署，这个好处在于企业在 AI 方面的应用会加速落地，我们国内的用户不需要那么麻烦的出海使用 ChatGPT 了。

YY 语音公司接入 DeepSeek 上线“YYDS”

YY 公司今日宣布接入 DeepSeek，并推出“低延时、不卡顿”的 YY-DeepSeek R1-满血版（简称“YYDS”），旗下 YY 直播、YY 语音等产品已经上线产品入口。