PI π0.7:机器人基础模型首次出现组合泛化
Published:
π0.7 做到了一件之前没有机器人模型做过的事:把训练时见过的技能拼在一起,解决训练时从没出现过的新任务。这个能力叫组合泛化。LLM 早就有了,机器人没有——直到现在。
从 π0 到 π0.7
- π0(2024.10): 证明”一个模型控制多类机器人”可行,但换环境成功率直接掉
- π0.5(2025.04): 解决陌生环境泛化,机器人第一次能在没去过的真实家庭里完成任务
- π*0.6(2025.11): 引入 RL,最难任务吞吐量翻倍,但每个任务要单独训
- π0.7(2026.04): 消掉了那个代价,同时多了组合泛化
空气炸锅实验
训练数据里完全没有”用空气炸锅煮红薯”。零样本直接上,能做一部分;用步骤语言指令引导,能做完。追查后发现只有两条”把篮子推进气炸锅”的演示加上 DROID 数据集的一些操作,模型把它们拼在一起用了。
跨机体迁移
用小型双臂收集叠衣服数据,换到 UR5e 工业双臂——手臂更重、惯量更大、夹爪完全不同。零数据直接能叠,成功率和 375 小时遥操经验的熟练操作员持平。两台机器人上的折叠策略完全不一样。
多模态提示
分步语言指令、执行质量元数据、视觉子目标图像、控制模式标签。以前没法用的数据全能救活:自主探索的失败轨迹、人类操作视频、其他平台的数据。
机器人基础模型和 LLM 越来越像了,而且在重走同一段历史。

