兆芯全系列整机形态成功部署 DeepSeek R1 大模型

上海兆芯集成电路股份有限公司今日发文宣布:近日,基于兆芯高性能通用处理器的 PC 终端、工作站以及服务器成功实现 DeepSeek-R1-Distill 模型(1.5B / 7B / 32B / 70B / 671B 等)的本地部署。

上海兆芯集成电路股份有限公司今日发文宣布:近日,基于兆芯高性能通用处理器的 PC 终端、工作站以及服务器成功实现 DeepSeek-R1-Distill 模型(1.5B / 7B / 32B / 70B / 671B 等)的本地部署

兆芯全系列整机形态成功部署 DeepSeek R1 大模型

据介绍,兆芯通用处理器具备覆盖笔记本、台式机、工作站、服务器的全栈硬件解决方案能力,原生支持以 Linux、Windows、国产操作系统、及国产 GPU 加速卡等为基础的 DeepSeek 大模型生态。

  • KX-7000 台式机:成功本地部署 DeepSeek-R1-7B 模型

  • KH-40000/16 工作站:成功部署 DeepSeek-R1-32B 模型

  • KH-40000/32 双路服务器:支持本地部署 DeepSeek R1 671B 模型

图片

AI在线从兆芯官方获悉,针对 DeepSeek-R1-671B 大模型,为更有效地测试服务器的兼容性,兆芯在不插入任何外界加速卡的情况下,基于开胜 KH-40000/32 处理器已经完成本地 DeepSeek-R1-671B 大模型的部署,完整地验证了兆芯服务器 CPU 架构承载千亿参数模型的硬件支撑能力。

相关资讯

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。

爆肝48小时!学会这8招,让DeepSeek变得超好用!

更多相关介绍:. 重磅好文! 8个章节带你全方位了解DeepSeek这两天,DeepSeek-R1 火的飞起,在中日美三个 Appstore 榜上登顶。