DeepSeek揭秘:AI推理系统背后的545%惊人利润率

DeepSeek在知乎开设官方账号,发布了《DeepSeek-V3/R1推理系统概览》技术文章,首次详细披露其模型推理系统的优化细节和成本利润率信息,标志着备受关注的"DeepSeek开源周"正式结束。 文章介绍了DeepSeek-V3/R1推理系统的两大优化目标:"更大的吞吐,更低的延迟"。 为实现这些目标,DeepSeek采用了大规模跨节点专家并行(EP)技术,尽管这增加了系统复杂性。

DeepSeek在知乎开设官方账号,发布了《DeepSeek-V3/R1推理系统概览》技术文章,首次详细披露其模型推理系统的优化细节和成本利润率信息,标志着备受关注的"DeepSeek开源周"正式结束。

DeepSeek

文章介绍了DeepSeek-V3/R1推理系统的两大优化目标:"更大的吞吐,更低的延迟"。为实现这些目标,DeepSeek采用了大规模跨节点专家并行(EP)技术,尽管这增加了系统复杂性。文章重点阐述了如何利用EP技术增加批量大小、隐藏传输耗时以及实现负载均衡。

特别值得注意的是,DeepSeek罕见地公开了其成本和利润率数据。文章披露:"假定GPU租赁成本为2美金/小时,总成本为$87,072/天。如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。"

相关资讯

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。

DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明

DeepSeek 官方:如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为 $562,027,成本利润率 545%。 但实际上没有这么多收入,因为 V3 的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。 太突然了!

硅基流动:DeepSeek-R1 & V3 API升级,支持批量推理、R1价格直降75%

硅基流动官微宣布,即刻起,硅基流动SiliconCloud平台的DeepSeek-R1&V3API支持批量推理(BatchInference)。 用户通过批量 API 发送请求到 SiliconCloud,不受实时推理速率限制的影响,预期可在24小时内完成任务。 相比实时推理,DeepSeek-V3 批量推理价格直降50%,其中,3月11日至3月18日,DeepSeek-R1批量推理优惠价格直降75%,输入价格为 1元 / 百万 Tokens、输出价格为4元 / 百万 Tokens。