如何评价智元GO-1大模型？“一脑多形”加速智能机器人落地

作者：舒云

2025-03-11 10:12

2025年3月10日，由华为前“天才少年”稚晖君（彭志辉）创立的智元机器人，正式发布首个通用具身基座大模型GO-1。这一突破性技术不仅填补了国内该领域空白，更以独特的ViLLA架构和32%成功率提升的实测数据，将具身智能推向新高度。这款模型如何重新定义机器人智能？

2025年3月10日，由华为前“天才少年”稚晖君（彭志辉）创立的智元机器人，正式发布首个通用具身基座大模型GO-1。这一突破性技术不仅填补了国内该领域空白，更以独特的ViLLA架构和32%成功率提升的实测数据，将具身智能推向新高度。这款模型如何重新定义机器人智能？其技术内核与应用潜力又将对行业产生何种影响？

技术突破：ViLLA架构重构机器人认知逻辑

GO-1的核心创新在于其首创的Vision-Language-Latent-Action（ViLLA）架构，这一架构由多模态大模型（VLM）与混合专家系统（MoE）深度融合而成，实现了从感知到决策再到执行的全链路智能化。

· VLM模块：通用场景理解的基石

VLM通过整合互联网海量图文数据，赋予机器人对物理世界的通用感知能力。例如，通过分析厨房场景的图片和视频，模型可自主识别餐具、液体容器等物体属性，并理解“倒水”等指令的语义关联。

· MoE混合专家系统：动作分解与执行的关键

MoE进一步拆分为Latent Planner（隐式规划器）和Action Expert（动作专家）。前者通过跨本体与人类操作视频学习通用动作逻辑，后者则基于百万级真机数据实现精细动作控制。测试表明，仅Latent Planner即可提升任务成功率12%（66%→78%）。

· 小样本泛化与持续进化能力

模型通过人类视频学习机制，仅需少量示范即可适应新任务。例如，在“补充饮料”任务中，GO-1通过学习不同容器和环境的操作视频，无需重新编程即可泛化到新场景16。此外，依托智元的数据回流系统，GO-1能在实际应用中持续优化性能，形成“越用越聪明”的闭环。

应用场景：从工业到家庭的通用化落地

GO-1的“一脑多形”特性，使其可适配双足人形、轮式双臂等不同机器人形态，覆盖多元场景：

· 工业领域：在智元“远征”系列人形机器人中，GO-1可自主调整生产线布局，完成从搬运到质检的全流程操作，解决柔性制造难题。

· 服务行业：搭载GO-1的“Genie”轮式机器人已实现餐厅桌面清理、酒店饮料补货等复杂任务，效率较传统方案提升40%。

· 家庭场景：小型人形机器人“灵犀X1”通过GO-1的自然语言理解能力，可执行照护老人、儿童陪伴等个性化指令。

行业影响：具身智能的范式转移

GO-1的发布标志着具身智能从专用模型向通用基座的跨越，其三大变革尤为显著：

1、任务泛化：突破单一任务限制，同一模型可执行倒水、清洁、补货等跨领域操作。

2、环境适应：通过仿真框架AgiBot Digital World生成的百万级轨迹数据，模型可应对开放世界的动态变化。

3、开发降本：传统机器人需针对每个任务单独训练，而GO-1的后训练成本降低70%以上，加速商业化落地。

结语：

从华为天才少年到机器人创业者，稚晖君用GO-1证明了具身智能的可行性。这款模型不仅是一次技术突破，更预示着机器人从“工具”向“伙伴”的身份转变。当机器能够理解语言、适应环境并自主进化时，我们或许正站在通用人工智能的临界点上——一个机器与人共生的智能社会，已不再遥远。

如何评价智元GO-1大模型？“一脑多形”加速智能机器人落地

相关资讯

Nature子刊 | KAUST团队训练大语言模型，进行作为近似语义蕴涵的蛋白质功能预测

只需百行代码，让H100提速30%，斯坦福开源全新AI加速框架

谷歌发布 Oscar 服务，帮助开发者通过 AI 智能体掌控开源软件项目