文章列表
推理效率与国外同类产品架构解决方案相当,国产飞腾 CPU 实现对 DeepSeek 全系列大模型端到端支持
飞腾信息技术有限公司旗下腾云 S5000C 和腾锐 D3000 成功实现对 DeepSeek 全系列大模型的端到端支持,覆盖数据中心和终端场景。
2/9/2025 11:18:05 PM
归泷
支持 API 调用,国家超算互联网平台上线 DeepSeek-R1 满血版
据“超算互联网”公众号消息,为满足开发者与企业端需求,国家超算互联网平台现已上线包括 R1 满血版的 DeepSeek 全家桶模型,并提供快速部署 API 调用及 AI web 应用服务。
2/9/2025 9:41:09 PM
归泷(实习)
DeepSeek-V3 API 优惠期结束,每百万输出 tokens 由 2 元升至 8 元
今日,DeepSeek-V3 API 服务的 45 天优惠价格体验期已结束,从 2 月 9 日开始将调整为新的价格:每百万输入 tokens 0.5 元(缓存命中)/2 元(缓存未命中),每百万输出 tokens 8 元。
2/9/2025 6:39:02 PM
浩渺
商汤大装置“万象平台”上架 DeepSeek 系列模型
北京市商汤科技开发有限公司昨日晚发文宣布,企业客户和开发者可在商汤大装置万象平台中,快速部署 DeepSeek-V3、DeepSeek-R1 等模型,可享受 3 个月内 1000 万 tokens 免费使用权益。
2/9/2025 5:30:36 PM
归泷
为什么中国只有一个 DeepSeek?
DeepSeek 风暴后,中国的大模型创业圈会发生什么样的变化? 近日来,笔者也与多位业内人士进行了探讨,发现国产大模型圈目前出现了两个极端:一个是极端的热血沸腾,另一个则是极端的霜打茄子。 前者以积极拥抱 DeepSeek 生态的算力厂商与模型服务厂商、以及原先没有能力参与大模型“军备竞赛”的开源受益者为代表,后者则以其他中国大模型创业公司(俗称“大模型六小虎”)与过去两年投资了这些公司的 VC 们为主,形成了一个“冰火两重天”的局面。
2/9/2025 5:23:00 PM
陈彩娴
美格智能:与 DeepSeek 开发公司无业务往来,相关模型适配工作处于早期研发阶段
美格智能在公告中提到,公司股票因被纳入 DeepSeek 概念股而出现异常波动,并澄清公司与 DeepSeek 开发公司杭州深度求索人工智能基础技术有限公司无直接或间接业务往来及股权关系。
2/9/2025 5:10:02 PM
归泷
斑马智行元神 AI 完成与 DeepSeek 技术融合,意图理解、融合推理和主动服务能力提升
斑马信息科技有限公司昨日晚发文宣布,斑马智行元神 AI 与 DeepSeek 大模型完成技术融合正式上线,首发支持多车型。
2/9/2025 4:01:27 PM
归泷(实习)
奇瑞智能大模型已与 DeepSeek 深度融合校验,逐步应用于更多新车型
奇瑞集团宣布目前已与国内领先的人工智能公司深度求索(DeepSeek)围绕智能化大模型系统展开深度技术融合。
2/9/2025 3:55:16 PM
浩渺
阿里云百炼上线全尺寸 DeepSeek 模型,1 元最高可享受 200 万 tokens
阿里云宣布百炼平台全面上线 DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B 等 6 款全尺寸模型。DeepSeek-V3、DeepSeek-R1 满血版可享各 100 万免费 tokens,蒸馏版 1 元最高可享受 200 万 tokens,即日起,所有用户可直接使用。
2/9/2025 3:10:35 PM
浩渺
推理和RL加速GPT-5.5到来?奥特曼公开GPT-4.5已就绪,年底发布全自主智能体
DeepSeek 以低成本模型搅动全球 AI 格局之际,OpenAI CEO Sam Altman 正在进行他的东京之旅。 与软银创始人孙正义敲定 5000 亿美元的巨额投资之前,Sam Altman 和 OpenAI CPO Kevin Weil 到访了东京大学,在师生问答环节中透露了更劲爆的消息:「在 OpenAI 内部,我们已经达到了 GPT-4.5,而达到 GPT-5.5 并不需要 100 倍以上的计算能力。 」「推理模型和强化学习技术的进步极大地提高了计算效率 —— 它允许较小的模型实现 GPT-6 级别的性能,而不需要 100 倍以上的计算能力。
2/9/2025 2:45:00 PM
机器之心
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。 这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。
2/9/2025 2:42:00 PM
机器之心
OpenAI内测Sora图像生成器,代号「papaya」,DALL-E 4即将推出?
一则非常重要的消息:除了已有的视频生成功能,OpenAI 似乎还在为 Sora 推出图像生成功能做准备。 OpenAI 正在内部测试这些图像生成功能:包括一个新的隐藏切换按钮,能允许用户在提示栏中直接在视频和图像生成之间切换。 如果切换到图像,提示栏的描述会提示你描述一幅图像。
2/9/2025 2:26:00 PM
机器之心
ai.com 域名现已跳转至 DeepSeek:各大模型薅了个遍,不停蹭热度
据IT之家小伙伴投稿,可能是人工智能企业最想要的域名 —— ai.com 变更了跳转页面,随着国内 AI 模型 DeepSeek 的大热,该域名目前已跳转至 chat.deepseek.com。
2/9/2025 12:51:08 PM
汪淼
OpenAI 内部模型曝光:编程能力跻身全球 Top50 程序员,年底不再有人类对手
除了 o1 / o3,OpenAI 另一个尚未公开的内部推理模型曝光了。爆料者正是 CEO 阿尔特曼本人。
2/9/2025 11:56:04 AM
汪淼
AI 能取代哪些人类工作?OpenAI ChatGPT Deep Research 给出答案
本周 OpenAI 推出了其 Deep Research 功能,这一功能借助该公司最新模型 o3 的一个版本,能够在短短几分钟内将网络上的相关内容整合成一份详细的报告。该功能是一个强大的工具,因为其可以通过自主完成研究来节省人类大量时间。然而,这项技术背后的基础模型是否会取代人类呢?Deep Research 的结果似乎给出了肯定的答案。
2/9/2025 11:31:54 AM
远洋
OpenAI 首席产品官表示:2025 年是 AI 智能体之年
在瑞士达沃斯举行的论坛上,OpenAI 首席产品官凯文・韦尔(Kevin Weil)于1月21日表示,我们正处于人工智能代理的边缘。 他预测,到2025年,ChatGPT 将不仅仅是一个可以回答各种问题的智能工具,而是能够在现实世界中为用户完成具体任务的 “智能助手”。 韦尔强调,人工智能代理将在未来很快能够处理许多日常琐事,这些事情往往让人感到烦恼,比如填写表格、预订餐厅等。
2/9/2025 8:59:54 AM
AI在线
奥特曼加码长寿科技:Retro Biosciences欲筹10亿美元,挑战人类寿命极限
由 OpenAI 首席执行官 Sam Altman 支持的生物科技初创公司 Retro Biosciences,正在进行一轮10亿美元的A轮融资,进一步加码其延长人类寿命的雄心。 此前,Altman曾向该公司投入1.8亿美元的种子轮融资。 Retro Biosciences的目标是不仅延长人类的寿命,更要延长健康寿命,使人们在生命的末期依然保持健康状态。
2/9/2025 8:59:42 AM
AI在线
DeepSeek深夜再放大招,发布全新多模态大模型Janus-Pro
国产大模型DeepSeek发布了全新的Janus-Pro多模态大模型,正式进军文生图领域。 这一举动标志着DeepSeek在多模态AI技术上的重大突破。 在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E3,还超越了Stable Diffusion、Emu3-Gen等热门模型。
2/9/2025 8:59:26 AM
AI在线