- 现有开放词汇移动操作(open-vocabulary mobile manipulation)系统在家庭场景下,因符号计划与物理世界的不一致性导致频繁失败,而非语义误解
- 系统普遍存在三个不足:依赖预扫描语义地图,场景变化后不一致;导航终点不考虑下游操作可行性,导致“到达但无法操作”;处理异常时采用无差别全局重规划,难以遏制局部错误
- 研究背景:家庭环境中的长时程任务执行要求可靠应对开放集物体引用和频繁干扰,现有方法无法满足鲁棒性需求
- 提出**物理接地闭环框架ANCHOR** ,整合三种机制:物理锚定任务规划(physically anchored task planning),将符号谓词绑定到可观察几何锚点并在每次动作后重新验证
- 采用** 可操作性感知基座对齐(operability-aware base alignment) ** ,确保导航终点满足运动学可达性(kinaematic reachability)和局部碰撞可行性
- 引入** 最小责任层分层恢复(minimum-responsible-layer hierarchical recovery)** ,在感知、基座-手臂协调(base-arm coordination)和执行层定位故障,防止级联重试
- **首次将物理接地(physical grounding)显式融入闭环框架** ,通过符号谓词与几何锚点的绑定及逐动作重验证,解决符号与物理世界的不一致
- ** 可操作性感知的导航终点选择** ,克服“到达但无法操作”问题,区别于仅依赖语义地图的现有方法
- ** 分层故障定位与最小责任层恢复** ,避免无差别全局重规划,显著提升扰动下的恢复率(71.4%)和任务成功率(从53.3%提升至71.7%)
- 为家庭服务移动操作提供了一种**物理接地闭环范式** ,证明了显式物理接地和结构化故障遏制对鲁棒性的重要性
- 在60次真实机器人实验中,任务成功率提升18.4个百分点,扰动恢复率达71.4%,展示了实际部署价值
- 开源项目页面,促进社区复现与后续研究