AIGC宇宙 AIGC宇宙

“AI 工厂”将推动软件全栈重塑,英伟达提供 Llama3 NIM 容器供用户部署

在目前正在进行的黄仁勋 2024 台北电脑展主题演讲上,黄仁勋介绍生成式人工智能将推动软件全栈重塑,展示其 NIM(Nvidia Inference Microservices)云原生微服务。英伟达认为“AI 工厂”将掀起一场新产业革命:以微软开创的软件行业为例,黄仁勋认为生成式人工智能将推动其全栈重塑。为方便各种规模的企业部署 AI 服务,英伟达今年 3 月推出了 NIM(Nvidia Inference Microservices)云原生微服务。NIM 是一套经过优化的云原生微服务,旨在缩短上市时间,并简化生成

在目前正在进行的黄仁勋 2024 台北电脑展主题演讲上,黄仁勋介绍生成式人工智能将推动软件全栈重塑,展示其 NIM(Nvidia Inference Microservices)云原生微服务。

新产业革命

英伟达认为“AI 工厂”将掀起一场新产业革命:以微软开创的软件行业为例,黄仁勋认为生成式人工智能将推动其全栈重塑。

软件全栈重塑

为方便各种规模的企业部署 AI 服务,英伟达今年 3 月推出了 NIM(Nvidia Inference Microservices)云原生微服务。

NIM 云原生微服务

NIM 是一套经过优化的云原生微服务,旨在缩短上市时间,并简化生成式 AI 模型在云、数据中心和 GPU 加速工作站的任何位置的部署。它使用行业标准 API,抽象化 AI 模型开发和生产包装的复杂性,从而扩展开发者池。

“AI 工厂”将推动软件全栈重塑,英伟达提供 Llama3 NIM 容器供用户部署

“AI 工厂”将推动软件全栈重塑,英伟达提供 Llama3 NIM 容器供用户部署

IT之家注意到,官方制作了一个 llama3 大模型的 NIM 容器,现已上线英伟达官网,开放供全部用户下载并任意部署。

“AI 工厂”将推动软件全栈重塑,英伟达提供 Llama3 NIM 容器供用户部署

英伟达官网

▲ 英伟达官网

2024 台北国际电脑展专题

相关资讯

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。
2/11/2025 2:25:00 PM
AI在线

DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型

今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM
AI在线

DeepSeek 更新 R1 推理 AI 模型:代码生成与复杂推理性能大幅提升 推理能力比肩 o1

DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。 以下基于公开信息和最新动态,全面解析此次更新的关键亮点。 R1模型更新:代码能力大幅提升DeepSeek-R1的最新更新在代码生成能力上取得了显著突破。
5/29/2025 10:01:21 AM
AI在线
testab