DeepSeek
景嘉微发布全国产 AI 加固服务器:预置 DeepSeek,开箱即用
服务器内置 Deepseek-R1 1.5B ~ 70B 蒸馏模型,支持零配置启动大模型的交互演示。开发者可快速调用预置模型接口。
不蒸馏 R1 也能超越 DeepSeek,上海 AI Lab 用 RL 突破数学推理极限
从 Qwen2.5-32B-Base 模型出发,仅通过微调和基于结果反馈的强化学习,在不蒸馏超大模型如 DeepSeek-R1 的情况下,就能超越 DeepSeek-R1-Distill-Qwen32B 和 OpenAI-O1 系列的超强数学推理性能。
深圳首批 70 名“AI 员工”上岗:基于 DeepSeek,覆盖公文处理、民生服务等 240 个场景
福田区已上线 11 大类 70 名“数智员工”,覆盖公文处理、民生服务、应急管理、招商引资等多元场景。
消息称微信正在内测接入 DeepSeek-R1 大模型
网友 @赛博禅心 今日爆料称,微信正在内测接入 DeepSeek-R1 大模型。IT之家注意到,该路径位于微信页面-搜索-AI 搜索。
大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
问题挺严重,大模型说的话可不能全信。 最近 DeepSeek 非常热门,我们也能在网上看到大量或严肃有用或幽默搞怪使用案例。 其中一个很有趣的现象是不少用户发现 DeepSeek 会见风使舵。
月之暗面因 DeepSeek 调整工作重心?内部人士:强化学习或许会是个方向
2 月 15 日下午消息,据媒体报道,月之暗面内部已经将“持续拿到 SOTA 结果”确定为当下最重要的工作目标。2025 年,月之暗面围绕模型能力的关键方向除了继续强化多模态部分外,还会继续强化长文本推理能力。
小米澎湃 HyperOS 悄悄下线「超级小爱」“打开深度思考”等 DeepSeek-R1 模型唤醒词
昨天有多位微博用户分享,小米澎湃 HyperOS「超级小爱」已接入 DeepSeek-R1 模型,支持写代码、写文章、逻辑推理等功能。但IT之家目前测试发现这项功能已悄悄下线,现在使用小爱输入“打开深度思考”唤醒词,只会收到“对不起,我还在学习中!”提示。
联想智能云深度集成DeepSeek R1大模型驱动企业“智能进阶”
记者今天从联想集团了解到,联想智能云(xCloud)解决方案已将DeepSeek R1及其蒸馏系列大模型全面集成到产品矩阵中,覆盖模型服务、模型开发、智能体构建、智能运维等核心环节。 据了解,联想智能云(xCloud)解决方案支持DeepSeek大模型的多种部署方式,包括云端、私有化和一体机/工作站等,可通过完整的AI能力体系和技术整合、场景创新与开源生态的构建,为企业智能化转型注入新动能。 全面支持DeepSeek R1-671B满血模型等全系模型。
DeepSeek 融入星纪魅族 AI 生态,手机及 AR 智能眼镜可直接语音使用
星纪魅族 AR 智能眼镜 StarV Air2 及 MYVU 目前已接入 DeepSeek 大模型,在 AI 语音助手等功能中根据用户提问内容动态调用 DeepSeek-V3 的能力,后续将允许用户自行选择是否调用 Deepseek-R1 大模型。
刚刚,DeepSeek官方发布R1模型推荐设置,这才是正确用法
自春节以来,DeepSeek 就一直是 AI 领域最热门的关键词,甚至可能没有之一,其官方 App 成为了史上最快突破 3000 万日活的应用。 最近一段时间,各家 AI 或云服务厂商更是掀起了部署 DeepSeek-R1 服务的狂潮,甚至让薅羊毛的用户们都有点忙不过来了。 就在刚刚,DeepSeek 官网 X 帐号终于更新了(上一次更新还是在 1 月 28 日),官方下场推荐了部署 DeepSeek-R1 的设置。
两轮电动车行业首个,九号将深度融合 DeepSeek 大模型
据介绍,通过接入 DeepSeek-R1,九号出行 App 将大幅提升用户图文创作能力、数据分析、个性化推荐、智能服务等功能,为用户更好地提供车辆控制、出行建议、个性化推荐及售后等服务。
被AI妆到了!DeepSeek教网友化妆,竟像极了「石矶娘娘」
AI好好用报道编辑:杨文DeepSeek的风吹到了美妆区。 DeepSeek 又又又来搞抽象了! 继上次做人类从未见过的菜之后,网友又想到了个新路数:教化妆。
AI应用新纪元:2025中国AI应用排行榜榜单揭晓丨2025年1月
AI在线 发布 2025年1月「AIGCRank 中国AI应用排行榜」
学而思发布全新“随时问”APP,DeepSeek随便用
全教育行业拥抱DeepSeek的浪潮还在继续,在产品层面的落地和结合也开始带来惊喜。 学而思今天正式发布接入DeepSeek的全新“随时问”APP。 该产品深度融合DeepSeek R1智能推理,依托学而思22年教研沉淀,现面向全国中小学生免费开放,提供苏格拉底式启发学习模式,支持题目分步解析、无限追问和智能错题管理,助力构建科学学习体系。
Grok 3两周内发布,要夺回大模型王座;DeepSeek现象后,AI会改变方向…蔡崇信、李彦宏、马斯克,大佬们在迪拜峰会说了啥
出品 | 51CTO技术栈(微信号:blog51cto)2025年世界政府峰会于2月11日在阿联酋迪拜开幕,不少科技大佬都参与了峰会,并表达了自己的真知灼见。 在这个关口谈论科技创新,AI无可避免地成为了绝对的主角。 马斯克吹捧Grok 3将成为有史以来最聪明的AI,“这(指新模型发布之前)可能是其他模型最后一次超过Grok”。
DeepSeek R1 遇难题 142 次 "I give up",研究还称需增加推理时机控制机制
Cursor 刚刚参与了一项研究,他们基于 NPR 周日谜题挑战(The Sunday Puzzle),构建了一个包含近 600 个问题新基准测试。
信我,有你想要的!最大化DeepSeek潜能:动态注意力机制
deepseek原理 应用 实践,和大家分享:小众的,deepseek核心技术原理;大众的,提示词要怎么写;今天和大家聊聊,deepseek的核心技术之一的动态注意力机制。 要搞懂这个,先得知道什么是注意力机制? 这是一种通过计算…查询向量(Query)…键向量(Key)…值向量(Value)…,最终得到...的技术。
报告:DeepSeek爆火激发山寨网站数量激增,超六成解析IP来自美国
尽管美国出台法律禁止下载和使用DeepSeek,甚至对违规者处以最高20年的刑期,但这一措施似乎并未遏制美国人对DeepSeek的兴趣,反而催生了大量山寨网站。 据奇安信XLab实验室的统计,从2024年12月1日至2025年2月3日的两个多月时间里,互联网上出现了2650多个山寨DeepSeek域名。 尤其是自2025年1月26日起,山寨域名开始大规模涌现,并在1月28日达到高峰,当天新增山寨域名超过800个。