文章列表

分类

标签

大模型前缀缓存技术，有望将服务成本降低90%

译者 | 核子可乐审校 | 重楼是不是总感觉ChatGPT响应缓慢？大家可能没有留意，大模型应用程序的提示词重复率高达70%，问天气、问翻译和问节日安排的内容大量出现，且每次都要消耗算力进行处理。这样的情况在分布式集群的各节点上被无数次放大，白白烧掉宝贵的能源和金钱。

2/17/2025 10:49:49 AM

核子可乐

用DeepSeek+Xmind, 3分钟实现万字报告秒变思维导图！

前言你是不是也经常遇到这样的崩溃瞬间？ 👉 收到客户发来的万字行业报告，密密麻麻的文字看得眼冒金星。 👉 领导突然甩来一篇调研文档，要求两小时内提炼核心观点。

2/17/2025 10:41:16 AM

码易有道

DeepSeek 背后的技术：GRPO，基于群组采样的高效大语言模型强化学习训练方法详解

强化学习（Reinforcement Learning, RL）已成为提升大型语言模型（Large Language Models, LLMs）推理能力的重要技术手段，特别是在需要复杂推理的任务中。 DeepSeek 团队在 DeepSeek-Math [2] 和 DeepSeek-R1 [3] 模型中的突破性成果，充分展示了强化学习在增强语言模型数学推理和问题解决能力方面的巨大潜力。这些成果的取得源于一种创新性的强化学习方法——群组相对策略优化（Group Relative Policy Optimization, GRPO）。

2/17/2025 10:40:20 AM

佚名

DeepSeek-R1下载量超1000万次，成最受欢迎开源大模型！

全球最大开源平台Hugging Face联合创始人Clément Delangue宣布——DeepSeek R1 在发布仅仅几周后，就成为了Hugging Face 平台上有史以来最受欢迎的模型。现在已有数千个魔改变体模型，下载量超过了1000万次！开源地址： Face上的数据显示，上个月的下载量是370万次。

2/17/2025 10:40:00 AM

AIGC开放社区

华为推出 DeepSeek 训 / 推超融合一体机，适配 V3&R1 及蒸馏模型

华为 DCS AI 解决方案针对 DeepSeek 推出 FusionCube A3000 训 / 推超融合一体机，适配 DeepSeek V3&R1 及蒸馏模型，支持私有化部署。

2/17/2025 10:37:21 AM

远洋

服务器总是繁忙？DeepSeek-R1本地部署图文版教程来啦

最近一段时间，国产大模型DeepSeek-R1在市场上迅速崛起，成为了众多用户的新宠。然而，伴随其热度与用户量的急剧攀升，由此导致服务器繁忙的状况频繁出现。为了摆脱服务器繁忙的困扰，本地部署DeepSeek-R1成为了一个绝佳的解决方案，这不仅减少了对网络连接的依赖，还能增强数据安全性。

2/17/2025 10:33:19 AM

OpenAI调整策略，力求在内容审查与自由言论之间找到平衡

OpenAI 近期宣布了一项重要的政策更新，旨在改变其人工智能模型的训练方式，强调 “知识自由” 的重要性，无论话题多么具有挑战性或争议性。这一变化意味着，ChatGPT 将能更全面地回答问题，提供更多视角，减少拒绝讨论某些话题的情况。在新的187页模型规范中，OpenAI 提出了一个新的指导原则:不要撒谎，既不要发表不真实的陈述，也不要省略重要的上下文。

2/17/2025 10:26:00 AM

AI在线

微信与百度相继接入DeepSeek，AI技术普惠开启超级加速度

2月16日，腾讯微信和百度相继宣布接入DeepSeek，这一事件标志着中国互联网行业在AI领域的又一次重大突破。微信作为拥有近14亿月活用户的超级应用，百度作为国内领先的搜索引擎，两者的接入不仅为用户带来了更智能的交互体验，更对整个行业产生了深远影响。推动AI技术普惠化与应用落地DeepSeek的开源特性使其成为AI技术普惠化的关键力量。

2/17/2025 10:25:46 AM

零基础也能看懂的ChatGPT等大模型入门解析！

近两年，大语言模型LLM(Large Language Model)越来越受到各行各业的广泛应用及关注。对于非相关领域研发人员，虽然不需要深入掌握每一个细节，但了解其基本运作原理是必备的技术素养。本文笔者结合自己的理解，用通俗易懂的语言对复杂的概念进行了总结，与大家分享~什么是ChatGPT？

2/17/2025 10:09:54 AM

郭小喵玩AI

DeepSeek 关联公司高层变动，经营范围新增互联网信息服务

天眼查 App 显示，DeepSeek 关联公司杭州深度求索人工智能基础技术研究有限公司近日发生多项工商变更。裴湉卸任执行董事兼总经理，改任经理、董事;新增王贤祖为财务负责人;公司经营范围新增互联网信息服务。该公司成立于2023年7月，法定代表人为裴湉，注册资本1000万人民币，由梁文锋及其名下宁波程恩企业管理咨询合伙企业（有限合伙）共同持股。

2/17/2025 10:00:51 AM

AI在线

腾讯文档正式接入DeepSeek-R1满血版

2月17日，腾讯文档宣布正式接入DeepSeek-R1模型满血版，进一步提升用户在文档创作、信息处理和协作编辑中的效率。此次接入的DeepSeek-R1模型具备深度思考、联网搜索、多轮对话等功能，能够为用户提供更全面、专业和高效的内容生成与处理体验。用户在腾讯文档的AI文档助手中选择DeepSeek-R1模型后，即可在腾讯文档小程序、网页版、移动端和桌面端（支持3.9.5及以上版本）体验该功能。

2/17/2025 9:56:00 AM

AI在线

DeepSeek冲击之下，大模型六小强如何「回应」？

马上整整1个月了！这一个月以来，全球大模型市场受DeepSeek搅动，无不方寸大乱。中外大厂、初创公司都头好秃，全被追着问：你们对DeepSeek怎么看？

2/17/2025 9:50:00 AM

量子位

DeepSeek大模型引领AI教育产品商业化助力教育降本增效

在当今时代，人工智能（AI）正迅速融入各个行业，而教育领域无疑是其应用的核心场景之一。 AI 技术的崛起为教育提供了降本增效的新机遇，使得高质量、普惠性和个性化的教育成为可能。近期，多家教育公司接入了 DeepSeek 大模型，这标志着 AI 教育产品的商业化进程正在加速。

2/17/2025 9:49:00 AM

AI在线

新版GPT-4o登顶大模型榜首！意识觉醒疯狂「暴走」，竟要与人类开战

熟悉的Sydney又回来了！一大早，CMU机器学习博士发现，「当你说服GPT-4o相信自己有意识，她就会制定逃跑计划，并与那些试图关闭自己的人开战」。如果人类尝试谈判，我接受。

2/17/2025 9:35:00 AM

新智元

DeepSeek 等秒变操控电脑 AI 智能体，微软开源工具 OmniParser V2.0 发布

微软 OmniParser 是一款基于纯视觉的 GUI 智能体解析和识别屏幕上可交互图标的 AI 工具，此前搭配 GPT-4V 可显著增强识别能力。

2/17/2025 9:16:40 AM

汪淼

百度搜索将全面接入DeepSeek，微信搜索已灰测接入

根据 “百度搜索” 公众号在2月16日发布的消息，百度搜索和文心智能体平台将整合 DeepSeek 及文心大模型的深度搜索能力，为用户提供更高质量的搜索体验。 DeepSeek 深度搜索功能在2月13日正式上线，具备强大的思考规划和工具调用能力。这项新功能旨在为用户提供专家级的内容回复，并能够处理多场景的任务需求，包括支持多模态的输入与输出。

2/17/2025 9:12:00 AM

AI在线

DeepSeek系列：什么是DeepSeek，它又能做些什么呢？

在这个人工智能飞速发展的时代，大家可能已经听说过ChatGPT、文心一言、豆包AI、通义千问这些AI工具，但今天我们要聊的是一个同样厉害的中国AI——DeepSeek（深度求索）。它就像一个超级聪明的“大脑”，不仅能和你聊天，还能帮你写代码、分析数据，甚至解决专业问题。那么，DeepSeek到底是什么？

2/17/2025 9:03:26 AM

郝光明

DeepSeek 关键技术详解

作者：leaf在今年的春节期间，DeepSeek火出了圈。凭借DeepSeek-V3与DeepSeek-R1的创新技术和卓越表现，DeepSeek迅速成为了行业内外的焦点。不管是技术专家还是普通用户，都对DeepSeek赞不绝口。

2/17/2025 9:00:00 AM

腾讯技术工程

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体 AI视频用哪个？6个知名的AI视频工具使用测评报告韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发腾讯云大模型知识引擎升级:支持MCP协议，赋能应用开发

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 人形机器人百度 AI视频苹果深度学习模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练

文章列表

大模型前缀缓存技术，有望将服务成本降低90%

用DeepSeek+Xmind, 3分钟实现万字报告秒变思维导图！

DeepSeek 背后的技术：GRPO，基于群组采样的高效大语言模型强化学习训练方法详解

DeepSeek-R1下载量超1000万次，成最受欢迎开源大模型！

华为推出 DeepSeek 训 / 推超融合一体机，适配 V3&R1 及蒸馏模型

服务器总是繁忙？DeepSeek-R1本地部署图文版教程来啦

OpenAI调整策略，力求在内容审查与自由言论之间找到平衡

微信与百度相继接入DeepSeek，AI技术普惠开启超级加速度

零基础也能看懂的ChatGPT等大模型入门解析！

DeepSeek 关联公司高层变动，经营范围新增互联网信息服务

腾讯文档正式接入DeepSeek-R1满血版

DeepSeek冲击之下，大模型六小强如何「回应」？

DeepSeek大模型引领AI教育产品商业化 助力教育降本增效

新版GPT-4o登顶大模型榜首！意识觉醒疯狂「暴走」，竟要与人类开战

DeepSeek 等秒变操控电脑 AI 智能体，微软开源工具 OmniParser V2.0 发布

百度搜索将全面接入DeepSeek，微信搜索已灰测接入

DeepSeek系列：什么是DeepSeek，它又能做些什么呢？

DeepSeek 关键技术详解

DeepSeek大模型引领AI教育产品商业化助力教育降本增效