- 解决**机器人操作(robotic manipulation)** 中在有限数据预算下部署**视觉-语言-动作(Vision-Language-Action, VLA)** 模型时面临的**多样性陷阱(diversity trap)** 问题
- 传统启发式方法“最大化覆盖”通过收集多样化的单次演示会因**非消失估计噪声(non-vanishing estimation noise)** 而导致性能适得其反
- 背景:机器人演示成本高昂,实际部署需在严格数据预算下进行**具身适应(embodiment gap bridging)**
- 提出**Anchor-Centric Adaptation (ACA)** 两阶段框架:第一阶段在**核心锚点(core anchors)** 处通过重复演示稳定**策略骨架(policy skeleton)**
- 第二阶段通过**教师强制错误挖掘(teacher-forced error mining)** 和**约束残差更新(constrained residual updates)** 选择性扩展到高风险边界
- 形式化定义**覆盖-密度权衡(Coverage—Density Trade-off)**,将策略误差分解为**估计(密度)误差** 和**外推(覆盖)误差**,并刻画固定预算下的最优分配
- **识别并形式化多样性陷阱**:首次指出“最大化覆盖”启发式在数据预算受限时会导致**自毁性** 性能,并给出严格数学分解
- **覆盖-密度权衡理论**:为策略误差提供解析表达,明确找到**内点最优分配**,指导数据收集策略
- **ACA两阶段范式**:打破传统均匀覆盖思路,先通过锚点重复稳定再定向扩展,兼顾**密度(density)** 与**覆盖(coverage)**
- **理论贡献**:建立了机器人策略适应中数据预算约束下的**覆盖-密度权衡框架**,为后续研究提供分析工具
- **方法贡献**:提出**Anchor-Centric Adaptation (ACA)** 方法,在真实机器人实验中显著提升任务可靠性和成功率
- **实践意义**:为**低数据预算下的VLA模型部署** 提供了高效、可验证的适应策略,有助于降低机器人演示成本