自家芯片助力：SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务

作者：溯波（实习）

2025-02-21 04:48

该推理服务由 SambaNova 的 SN40L RDU 芯片驱动，这一芯片采用了一种 SRAM-HBM-DDR 的三层存储结构。

AI 芯片与解决方案企业 SambaNova 宣布在其基于自研 SN40L RDU 处理器的云平台上推出号称“市面最快”的 DeepSeek-R1 671B 模型推理云服务，并表示其 token 输出速度可达每 prompt 每秒 198 个。

自家芯片助力：SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务

SambaNova 的 SN40L RDU 芯片基于台积电 5nm 制程，BF16 算力可达 638 TFLOPS。其采用了一种三层存储结构：片上的 520MB SRAM 缓存、2.5D 封装集成的 64GB HBM 内存、片外的 1.5TB 超大容量 DDR DRAM 内存，这使得单芯片能容纳的参数远超一般竞品。

此外 SN40L RDU 在结构上的灵活性使得其能动态重新配置硬件资源和数据流，提升计算与访存效率。

自家芯片助力：SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务

SambaNova 宣称，其仅需一台容纳 16 个 SN40L RDU 芯片的机架就能完成 DeepSeek-R1 671B 部署。

自家芯片助力：SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务

相关标签：

人工智能 DeepSeek SambaNova

相关资讯

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

OpenAI o1 的发布，再次给 AI 领域带来了一场地震。o1 能像人类一样「思考」复杂问题，拥有优秀的通用推理能力。在未经专门训练的情况下，o1 能够直接拿下数学奥赛金牌，甚至能在博士级别的科学问答环节上超越人类专家。

OpenAI首席研究官：DeepSeek独立发现了o1的一些核心思路，奥特曼、LeCun纷纷置评

OpenAI首席研究官：DeepSeek独立发现了o1的一些核心思路，奥特曼、LeCun纷纷置评

成本打下来了，需求更多才对？春节这几天，国内外 AI 圈都被 DeepSeek 刷了屏。英伟达的股市震荡更是让全世界看得目瞪口呆（参见《英伟达市值蒸发近 6000 亿美元，而 DeepSeek 刚刚又开源新模型》）。

“新神登场”，消息称 DeepSeek R2 模型有望 5 月前发布

“新神登场”，消息称 DeepSeek R2 模型有望 5 月前发布

据路透社报道，三位知情人士透露，DeepSeek 正在加速推出其 R2 人工智能模型，该公司最初计划在五月推出，但目前正在努力尽快推出。

资讯热榜

使用 VLLM 部署 DeepSeek：基于 Ubuntu 22.04 + RTX 4090 + Docker 的完整指南 Ollama的配置修改与接口调用一条神奇的指令，DeepSeek直接文生图 OpenAI突然发布智能体API！支持网络和文件搜索以及computer use 最新版DeepSeek保姆喂饭级安装教程：本地部署+避坑指南（升级版）从DeepSeek MoE专家负载均衡谈起基于Dify与DeepSeek：零门槛训练自己的专属AI大模型 OpenAI深夜大招暴打Manus！智能体全家桶杀器一统API，4行代码轻松上手

标签云