PI π0.7：机器人基础模型首次出现组合泛化

less than 1 minute read

Published: April 18, 2026

π0.7 做到了一件之前没有机器人模型做过的事：把训练时见过的技能拼在一起，解决训练时从没出现过的新任务。这个能力叫组合泛化。LLM 早就有了，机器人没有——直到现在。

从 π0 到 π0.7

π0（2024.10）： 证明”一个模型控制多类机器人”可行，但换环境成功率直接掉
π0.5（2025.04）： 解决陌生环境泛化，机器人第一次能在没去过的真实家庭里完成任务
π*0.6（2025.11）： 引入 RL，最难任务吞吐量翻倍，但每个任务要单独训
π0.7（2026.04）： 消掉了那个代价，同时多了组合泛化

空气炸锅实验

训练数据里完全没有”用空气炸锅煮红薯”。零样本直接上，能做一部分；用步骤语言指令引导，能做完。追查后发现只有两条”把篮子推进气炸锅”的演示加上 DROID 数据集的一些操作，模型把它们拼在一起用了。

跨机体迁移

用小型双臂收集叠衣服数据，换到 UR5e 工业双臂——手臂更重、惯量更大、夹爪完全不同。零数据直接能叠，成功率和 375 小时遥操经验的熟练操作员持平。两台机器人上的折叠策略完全不一样。

多模态提示

分步语言指令、执行质量元数据、视觉子目标图像、控制模式标签。以前没法用的数据全能救活：自主探索的失败轨迹、人类操作视频、其他平台的数据。

机器人基础模型和 LLM 越来越像了，而且在重走同一段历史。

原文：π0.7: a Steerable Model with Emergent Capabilities

Share on

Twitter Facebook LinkedIn

You May Also Enjoy

AI 周报 W20：可解释性 / Agent 商业化 / 本地部署 / 多模态 RAG

2 minute read

Published: May 16, 2026

本周 Top 10 速览：可解释性、Agent 商业化、本地部署、多模态 RAG、Tool Calling 蒸馏、VLA 部署、人形机器人协作。

小米 MiMo-V2.5：100万 token 上下文，比 Claude 便宜 10 倍

less than 1 minute read

Published: April 29, 2026

小米发布 MiMo-V2.5，310B 参数的稀疏 MoE 模型，激活参数只有 15B，推理成本接近一个小模型，能力是旗舰级别的。原生支持图片和音频输入，上下文最长 100 万 token，权重完整开源在 HuggingFace。

less than 1 minute read

京东 JoyAI-RA：人类视频终于不再只是机器人论文里的陪衬数据

less than 1 minute read

Published: April 25, 2026

JoyAI-RA 最值得看的地方，不是它在 RoboCasa GR1 Tabletop 上拿了 63.2%，而是京东把一件很多人都知道难、但一直没真做通的事往前推了一步：人类操作视频，终于不再只是机器人论文里的陪衬数据。