AIGC宇宙 AIGC宇宙

清华团队开源 “赤兔 Chitu” 推理引擎,助力国产 AI 生态发展

作者:AI在线
2025-03-15 09:55
近日,清华大学高性能计算研究所的翟季冬教授团队与清华系科创企业清程极智联合发布了一个激动人心的消息 —— 开源大模型推理引擎 “赤兔 Chitu”。 这一创新性技术的推出,标志着国内在 AI 领域的又一重要突破,尤其是在推理引擎的开发上。 “赤兔 Chitu” 引擎的核心亮点在于其能够在非英伟达 Hopper 架构的 GPU 和各类国产芯片上,原生运行 FP8精度模型。

近日,清华大学高性能计算研究所的翟季冬教授团队与清华系科创企业清程极智联合发布了一个激动人心的消息 —— 开源大模型推理引擎 “赤兔 Chitu”。这一创新性技术的推出,标志着国内在 AI 领域的又一重要突破,尤其是在推理引擎的开发上。

“赤兔 Chitu” 引擎的核心亮点在于其能够在非英伟达 Hopper 架构的 GPU 和各类国产芯片上,原生运行 FP8精度模型。这意味着,无论是依赖于进口芯片还是国产芯片,开发者都能利用这一推理引擎实现高效的 AI 模型推理。这一进展不仅推动了国产 AI 芯片的广泛应用,也为国内的 AI 生态建设提供了强有力的技术支持。

元宇宙 科幻 赛博朋克 绘画 (1)大模型

图源备注:图片由AI生成,图片授权服务商Midjourney

清程极智的 CEO 汤雄超在发布会上表示,当前国内在推理引擎这一核心环节仍然缺乏生产级的开源产品。而 “赤兔 Chitu” 的开源,正是为了解决这一痛点,助力国内 AI 生态的建设。通过开放源代码,开发者和研究人员可以自由地使用、修改和优化这一推理引擎,加速国内 AI 技术的迭代和创新。

在全球 AI 技术竞争日益激烈的背景下,清华团队的这一举措将为国内企业在 AI 领域的发展提供新的机会。借助 “赤兔 Chitu” 推理引擎,企业能够更快速地研发出符合市场需求的 AI 产品,提升整体竞争力。此外,开源的方式也将吸引更多的开发者参与到 AI 的研发中,共同推动技术的进步。

“赤兔 Chitu” 的发布不仅是技术上的一次创新,更是推动国产 AI 产业链完善的一步。未来,期待有更多的企业和开发者能够借助这一工具,在 AI 的海洋中乘风破浪,开创属于中国的 AI 新时代。

相关资讯

FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎

随着 DeepSeek 引燃市场对于大模型私有化部署的热情,模型部署的效率与成本成为企业 AI 落地的关键瓶颈。 今天,清华系科创企业清程极智与清华大学翟季冬教授团队联合宣布开源大模型推理引擎「赤兔」(Chitu),率先实现了非 H 卡设备(英伟达 Hopper 架构之前的 GPU 卡及各类国产卡)运行原生 FP8 模型的突破。 在 A800 集群上的实测数据显示,用赤兔引擎部署 DeepSeek-671B 满血版推理服务,相比于 vLLM 部署方案,不仅使用的 GPU 数量减少了 50%,而且输出速度还提升了 3.15 倍。
3/14/2025 12:06:00 PM
机器之心

万字长文总结:DeepSeek 引发的 AI Infra 变革正在「加速」丨GAIR Live

作者丨朱可轩编辑丨陈彩娴DeepSeek 在进一步点燃 AI Infra 可能性的同时,也带来了新的竞争格局,在 DeepSeek 的范式上,其他厂商能否追赶甚至实现超越尤为关键,这决定了他们能否继续留在牌桌上,当前,AI Infra 已然进入新的洗牌期。 圆桌主持人为 3C AGI Partners 创始人兼 CEO 王康曼,她一直专注于投资 AI Infra 赛道,其创立基金成立后仅一年多就已经成为英伟达全球 VC 联盟成员,也投资了海外发展势头最猛的两家 AI 芯片创业公司 Cerebras Systems 和 Groq。 同时,圆桌还邀请了魔形智能创始人CEO徐凌杰、探微芯联 CEO 刘学和清程极智联合创始人师天麾共同开启了一场深度对话。
3/31/2025 3:50:00 PM
朱可轩

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线