DeepSeek

波士顿动力创始人自曝已购买宇树机器人,并称 DeepSeek 创新“只是开始”

“我们的实验室买了宇树的人形机器人,还买了几个小型的机器人,它们相对便宜。即便我们是竞争对手,我们也可以买来看看它究竟能做些什么。”

DeepSeek FlashMLA:大模型推理的“涡轮增压器”

FlashMLA(Flash Multi-head Latent Attention)是DeepSeek针对英伟达Hopper架构GPU(如H800/H100)设计的高效解码内核,其核心技术围绕多头潜在注意力(MLA)机制展开,通过软硬件协同优化实现性能突破

DeepSeek,2025 最值得学习十个 Vue3 库源码?

VueUse - 组合式API工具集GitHub: ,提供 200 组合式 API 函数。 其模块化架构和TypeScript 类型系统堪称典范,适合学习如何组织大型工具类项目。 源码中可重点研究 useStorage 的状态同步机制和 useEventListener 的事件管理设计2.

DeepSeek R1 满血版来了,完全不卡!

前言最近DeepSeek爆火。 我之前也发过多篇关于DeepSeek的文章,推荐大家使用它。 今年是AI的一个风口。

五分钟,构建国产数据库智能体

近期,圈里很多朋友,都尝试利用 DeepSeek 构建自己的智能体。 我也利用腾讯元器,将个人公众号内容做了个智能体,可以实现简单的问答。 那么延展来看,智能体除了可利用公众号内容,也可使用离线文件等方式来构建。

如何用DeepSeek轻松搞定复杂工作?实操手册来了!

在职场中,我们每天都要面对写报告、做汇报、申请专利这些耗时又烧脑的任务。 明明知道这些工作很重要,却常常因为思路不清、效率低下而加班到深夜。 在 DeepSeek出来之前,我其实也都在利用它帮我解决类似的这些问题,老读者应该都知道我写 AI 相关的教程是最快的,从 22 年 AI 还没那么火的时候,我就已经在写这些教程了。

兆芯全系列整机形态成功部署 DeepSeek R1 大模型

上海兆芯集成电路股份有限公司今日发文宣布:近日,基于兆芯高性能通用处理器的 PC 终端、工作站以及服务器成功实现 DeepSeek-R1-Distill 模型(1.5B / 7B / 32B / 70B / 671B 等)的本地部署。

腾讯云智能数智人、企点客服全面接入DeepSeek

2月24日,腾讯云智能数智人和腾讯企点客服正式宣布接入DeepSeek大模型,借助其卓越的语义理解和意图识别能力,进一步优化用户体验,提升服务质量和客户满意度。 腾讯云智能数智人全面接入DeepSeek大模型后,用户无需开发即可通过数智人平台内置的V3、R1等模型,让DeepSeek拥有真人外观并实现自然流畅的交互。 在交互场景中,数智人能够快速整合多源信息,提供精准解答,并支持多轮对话与上下文理解,广泛应用于政策问答、景区导览、展厅接待等场景。

双擎升级!商汤大装置DeepSeek企业版上线+免费版扩容

今年2月,商汤大装置万象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型,并为免费版提供3个月内千万Token额度,受到客户的热烈响应。 为了更好的服务用户,经过系列优化,,现正式推出企业版,同时完成免费版国产化适配与算力扩容,形成专业强支撑 普惠广覆盖的双擎驱动! 登录官网,即刻体验!

腾讯元宝超越豆包登上苹果中国区APP免费榜第二 DeepSeek稳坐第一

近日,苹果中国区 APP 免费榜迎来了新的变化,腾讯的元宝应用一跃而起,超越豆包,跻身排行榜第二位。 榜首的位置则被 DeepSeek 牢牢占据。 这一现象不仅反映了市场竞争的激烈,也展示了国内大模型行业快速发展的势头。

月之暗面推出新优化器Muon,计算效率大幅提升

近日,人工智能领域再度掀起波澜,月之暗面(Moonshot)宣布开源新版优化器 Muon,成功将计算效率提升至传统 AdamW 的两倍。 这个新优化器的推出恰逢 DeepSeek 即将连续开源多个代码库,引发了业内的高度关注和讨论。 Muon 优化器最初由 OpenAI 的研究者 Keller Jordan 等人在2024年提出,针对小规模模型训练时表现优异。

DeepSeek一夜把百度干回20年前,网友:还有这好事?

没完了,刚刚接入DeepSeek的百度,又双叒叕搞事情了。 最新消息,“百度一下 你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan,回归了。 有意思的是,这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。

多行业拥抱DeepSeek,全不顾它身上的“刺”

在数字化浪潮席卷全球的今天,技术革命的脚步正以指数级速率重构人类社会发展轨迹。 而DeepSeek的出现,毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付,从医疗影像的毫厘级诊断到教育资源的跨时空共享,算法与数据的交织已然突破想象力的边界。 当下,众多产业正在与人工智能产生"化学反应",这种由技术创新引发的链式反应,正在三百六十度解构既有行业秩序,催生出"生产力跃迁2.0"时代的全新商业生态。

梁文锋亲自挂名,DeepSeek 最新论文丢出注意力新机制,推理速度直线提升 11 倍

2 月 18 日,马斯克发布 Grok 3 的热度还没过去,梁文锋就作为 co-authors 带着 DeepSeek 研究团队杀了回来。 公布新研究的推文发布不到 3 个小时,就带来了三十多万的浏览量,火爆程度不逊 OpenAI。 而这次 DeepSeek 团队最新的研究论文更是重磅,论文中介绍了一种全新的,可用于超快速的长上下文训练与推理的注意力机制 —— NSA,值得一提的是,NSA 还具有与硬件对齐的特点,十足的硬件友好。

腾讯健康接入DeepSeek+腾讯混元双模型 升级就医体验

2月24日,腾讯健康宣布通过腾讯云全面接入DeepSeek大模型,并与腾讯自研的混元大模型“双核组队”,全面升级医疗服务,涵盖智能导诊、预问诊、健康问答、智能用药、症状自查、影像报告解读及质控等多个场景。 这一升级旨在帮助全国超过1000家医院快速提升智能应用水平,并为医疗机构、体检中心、药械企业和基因测序企业提供多模型部署及应用方案。 此次升级围绕就医全流程展开,从诊前的健康问答、症状自查和智能导诊,到诊中的智能预问诊,再到诊后的报告解读和智能用药,腾讯健康正逐步将服务切换至“多模型”模式。

DeepSeek开源周“第一刀”砍向算力!重磅开源FlashMLA,挑战H800算力极限,网友直呼:极致的工程设计!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)上周五,DeepSeek刚刚预告了重磅开源周! 周一一早,DeepSeek就履行承诺,开源了针对 Hopper GPU 的高效 MLA 解码内核——FlashMLA! 图片根据DeepSeek介绍,FlashMLA内核针对变长序列进行了优化,是已投入生产的核心技术。

从理论到实践:学会如何商用 DeepSeek,收藏这一篇就够了

Hi,大家好,我叫秋水,当前专注于 AI Agent 和 AI 工作流自动化。 近期 DeepSeek,全球闻名,大家纷纷在讨论,我看过很多文章和视频,很多说的有点夸张,23 年 AI 刚来的那些内容,又重新说了一遍,只是把 AI 两个字母换成了 DeepSeek。 在我看来,DeepSeek 出圈的主要原因是能力强、价格低、开源、可以本地部署,这个好处在于企业在 AI 方面的应用会加速落地,我们国内的用户不需要那么麻烦的出海使用 ChatGPT 了。

YY 语音公司接入 DeepSeek 上线“YYDS”

YY 公司今日宣布接入 DeepSeek,并推出“低延时、不卡顿”的 YY-DeepSeek R1-满血版(简称“YYDS”),旗下 YY 直播、YY 语音等产品已经上线产品入口。