IBM 企业级 AI 开发平台 watsonx.ai 上线 DeepSeek R1 蒸馏模型

作者：清源

2025-02-11 12:36

根据官方介绍，DeepSeek 还借助知识蒸馏技术，利用 R1 模型生成的数据优化了多个 Llama 和 Qwen 变体。

IBM 日前宣布，DeepSeek-R1 蒸馏版 Llama 3.1 8B 和 Llama 3.3 70B 现已上线 IBM 的企业级 AI 开发平台 watsonx.ai。

根据官方介绍，DeepSeek 还借助知识蒸馏技术，利用 R1 模型生成的数据优化了多个 Llama 和 Qwen 变体。用户可通过以下方式在 watsonx.ai 上使用 DeepSeek 蒸馏模型：

DeepSeek-R1 具备强大的推理能力，适用于多个领域：

开发者可在 watsonx.ai 上利用 DeepSeek-R1 进行 AI 解决方案开发，并使用以下解决方案能力：

IBM watsonx.ai 提供灵活的开源模型定制选项，支持 DeepSeek-R1 在不同环境下的部署，并简化智能体开发、微调、RAG、提示工程等工作流。此外，watsonx.ai 内置安全机制，保障用户应用的安全性。

据AI在线此前报道，IBM 首席执行官本月初曾发表长文称，他们（DeepSeek）仅用约 2000 枚英伟达芯片，以大约 600 万美元的成本训练了最新的模型，远低于行业预期。这再次证明，小型、高效的模型也能带来实际成果，无需依赖庞大而昂贵的专有系统。

相关资讯