IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。

在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。首先,IBM 在 “按需部署”目录中提供了 Llama 蒸馏版,用户可部署专用实例以确保安全推理。其次,用户还可以通过 “自定义基础模型” 导入功能,上传 DeepSeek-R1的其他变体,例如 Qwen 蒸馏模型,从而满足多样化的应用需求。

DeepSeek

DeepSeek-R1具备强大的推理能力,适用于广泛的领域,为企业和开发者提供了高效且灵活的 AI 解决方案。此次更新进一步丰富了 watsonx.ai的模型生态系统,助力用户更便捷地开发和部署 AI 应用。

相关资讯

​IBM 与联想携手推进沙特阿拉伯生成式人工智能发展

在近期举行的 LEAP2025大会上,IBM 与联想宣布将进一步扩大两家公司之间的战略技术合作关系,旨在提升生成式人工智能在沙特阿拉伯的应用与影响力。 根据 IDC 的预测,到2026年,全球在人工智能相关系统上的年度支出将超过3000亿美元,沙特阿拉伯的众多领先组织也正在积极探索和投资生成式人工智能的应用场景,以应对即将到来的 “人工智能无处不在” 时代。 图源备注:图片由AI生成,图片授权服务商Midjourney此次合作将基于 IBM 与联想之间长达20年的伙伴关系,双方计划共同推出一系列 AI 解决方案。

DeepSeek称遭到大规模恶意攻击,注册或受影响

DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击,导致注册过程可能变得繁忙。 DeepSeek提醒用户,如果遇到注册困难,可以稍等后重试。 已注册用户可以正常登录,不受影响。

“新神登场”,消息称 DeepSeek R2 模型有望 5 月前发布

据路透社报道,三位知情人士透露,DeepSeek 正在加速推出其 R2 人工智能模型,该公司最初计划在五月推出,但目前正在努力尽快推出。