自家芯片助力:SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务

该推理服务由 SambaNova 的 SN40L RDU 芯片驱动,这一芯片采用了一种 SRAM-HBM-DDR 的三层存储结构。

AI 芯片与解决方案企业 SambaNova 宣布在其基于自研 SN40L RDU 处理器的云平台上推出号称“市面最快”的 DeepSeek-R1 671B 模型推理云服务,并表示其 token 输出速度可达每 prompt 每秒 198 个。

自家芯片助力:SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务

SambaNova 的 SN40L RDU 芯片基于台积电 5nm 制程,BF16 算力可达 638 TFLOPS。其采用了一种三层存储结构:片上的 520MB SRAM 缓存、2.5D 封装集成的 64GB HBM 内存、片外的 1.5TB 超大容量 DDR DRAM 内存,这使得单芯片能容纳的参数远超一般竞品

此外 SN40L RDU 在结构上的灵活性使得其能动态重新配置硬件资源和数据流,提升计算与访存效率。

自家芯片助力:SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务

SambaNova 宣称,其仅需一台容纳 16 个 SN40L RDU 芯片的机架就能完成 DeepSeek-R1 671B 部署。

自家芯片助力:SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务

相关资讯

大模型步入「推理Scaling」时代,SambaNova如何挑战英伟达的霸主地位?

OpenAI o1 的发布,再次给 AI 领域带来了一场地震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。

“新神登场”,消息称 DeepSeek R2 模型有望 5 月前发布

据路透社报道,三位知情人士透露,DeepSeek 正在加速推出其 R2 人工智能模型,该公司最初计划在五月推出,但目前正在努力尽快推出。