- 现有**组合式机器人策略(compositional robot policies)** 方法(如BLADE、SymSkill、Generative Skill Chaining)将技能库视为测试时冻结的,未分析当某个技能被替换时组合结果如何变化
- 在双臂插销任务中发现**主导技能效应(dominant-skill effect)**:一个**基元控制模块(ECM)** 成功率达86.7%,而其他每个ECM≤26.7%,该ECM是否进入组合导致成功率变化高达+50个百分点
- 离线策略的行为距离指标无法识别主导ECM,缺乏低成本、可部署的预测器来指导技能更新
- 在**robosuite操作任务(robosuite manipulation tasks)** 上引入**配对采样跨版本交换协议(paired-sampling cross-version swap protocol)**,系统探究技能替换对组合结果的影响
- 提出**原子质量探针(atomic-quality probe)**,以每个技能为单位进行零决策成本的探针评估
- 设计**混合选择器(Hybrid Selector)**,结合每个技能的探针(零决策成本)与选择性组合再验证(全成本),在144个技能更新决策上刻画**帕累托前沿(Pareto frontier)**
- **首次提出** 用于**组合机器人策略(compositional robot policies)** 中技能更新治理的**原子质量探针(atomic-quality probe)**,是第一个有原则、可部署的基元
- 发现并表征了**主导技能效应(dominant-skill effect)**,揭示了技能库中单一基元对组合性能的支配性影响
- 实现零决策成本下接近全再验证的性能:在T6任务上,原子探针仅比全再验证低23个百分点(64.6% vs 87.5%),混合选择器(m=10)将差距缩小至约12个百分点,成本仅为全再验证的46%;跨任务平均时,原子探针在混合基准限制下差距缩小至3个百分点以内
- 填补了组合策略中技能更新时组合结果变化分析的空白,为**技能更新治理(skill-update governance)** 提供了全新范式
- 通过三个不同难度任务(双臂插销、简单拾取等)的系统实验,验证了方法的有效性与边界条件
- 提出可部署的**原子质量探针(atomic-quality probe)** 及其与选择性再验证结合的**混合选择器(Hybrid Selector)**,为实际机器人系统持续更新技能库提供了高效、低成本的决策工具