← 返回论文列表

ANCHOR:一种基于物理的闭环框架,用于鲁棒的家用服务移动操作
ANCHOR: A Physically Grounded Closed-Loop Framework for Robust Home-Service Mobile Manipulation

作者: Jinhao Jiang, Shengyu Fang, Sibo Zuo 等5人
arXiv: 2604.25323v1
分类: cs.RO
📝 论文摘要
开放词汇移动操作的最新进展已将机器人带入真实家庭环境。在此类场景中,面对开放集物体引用和频繁干扰时的可靠长周期执行变得至关重要。然而,许多失败仍然存在。这些失败并非源于语义理解错误,而是因为符号规划与动态演变的物理世界之间存在不一致性,表现为三种反复出现的局限性:(i) 现有系统通常依赖预扫描的语义地图,在场景变化和干扰后会产生不一致性;(ii) 它们选择导航目标点时未考虑下游操作可行性,导致"到达但无法操作"的问题;(iii) 它们通过无差别的全局重规划处理异常,往往无法有效遏制局部错误。为解决这种执行不一致性,我们提出了ANCHOR——一个基于物理闭环的框架,在执行过程中将符号推理与可验证的物理状态对齐。ANCHOR整合了三种机制:(i) 物理锚定任务规划,将符号谓词绑定到可观测的几何锚点,并在每次动作后重新验证;(ii) 可操作性感知的基座对齐,确保导航目标点满足运动学可达性和局部碰撞可行性;(iii) 最小责任层分层恢复,将故障定位在感知、基座-手臂协调和执行层,防止级联重试。在60次未见环境下的真实机器人试验中,ANCHOR将任务成功率从53.3%提升至71.7%,并在扰动下实现了71.4%的恢复率,表明显式的物理锚定和结构化故障遏制对鲁棒移动操作至关重要。我们的项目页面位于https://anchor9178.github.io/ANCHOR/。

📊 核心分析

🎯 研究动机
- 现有开放词汇移动操作(open-vocabulary mobile manipulation)系统在家庭场景下,因符号计划与物理世界的不一致性导致频繁失败,而非语义误解 - 系统普遍存在三个不足:依赖预扫描语义地图,场景变化后不一致;导航终点不考虑下游操作可行性,导致“到达但无法操作”;处理异常时采用无差别全局重规划,难以遏制局部错误 - 研究背景:家庭环境中的长时程任务执行要求可靠应对开放集物体引用和频繁干扰,现有方法无法满足鲁棒性需求
🔧 核心方法
- 提出**物理接地闭环框架ANCHOR** ,整合三种机制:物理锚定任务规划(physically anchored task planning),将符号谓词绑定到可观察几何锚点并在每次动作后重新验证 - 采用** 可操作性感知基座对齐(operability-aware base alignment) ** ,确保导航终点满足运动学可达性(kinaematic reachability)和局部碰撞可行性 - 引入** 最小责任层分层恢复(minimum-responsible-layer hierarchical recovery)** ,在感知、基座-手臂协调(base-arm coordination)和执行层定位故障,防止级联重试
💡 核心创新
- **首次将物理接地(physical grounding)显式融入闭环框架** ,通过符号谓词与几何锚点的绑定及逐动作重验证,解决符号与物理世界的不一致 - ** 可操作性感知的导航终点选择** ,克服“到达但无法操作”问题,区别于仅依赖语义地图的现有方法 - ** 分层故障定位与最小责任层恢复** ,避免无差别全局重规划,显著提升扰动下的恢复率(71.4%)和任务成功率(从53.3%提升至71.7%)
🏆 总体贡献
- 为家庭服务移动操作提供了一种**物理接地闭环范式** ,证明了显式物理接地和结构化故障遏制对鲁棒性的重要性 - 在60次真实机器人实验中,任务成功率提升18.4个百分点,扰动恢复率达71.4%,展示了实际部署价值 - 开源项目页面,促进社区复现与后续研究