2026年2月12日消息,小米开源首代机器人 VLA 大模型 Xiaomi-Robotics-0,通过采用“大脑+小脑”混合架构实现实时控制,在三大主流的仿真测试和现实真机任务中均获得优异成绩。
2026年2月12日消息,小米开源首代机器人VLA大模型Xiaomi-Robotics-0,通过采用“大脑+小脑”混合架构实现实时控制,在三大主流的仿真测试和现实真机任务中均获得优异成绩。

据了解,这是一个拥有47亿参数、兼具视觉语言理解与高性能实时执行能力的开源 VLA 模型。它不仅在三大主流的仿真测试中获得优异成绩,更在现实真机任务中实现了物理智能的泛化,动作连贯、反应灵敏,且能在消费级显卡上实现实时推理。同时,模型“大脑”基于多模态视觉语言模型,负责理解人类指令与空间关系;“小脑”采用多层Diffusion Transformer,生成高频、平滑的动作块,实现精准连贯的物理操作。

此外,模型具备强泛化能力,既能执行操作又不丢失视觉理解与逻辑推理能力,实现“既会干活,也能答问”。