- 解决机器人在**未知非结构化环境(unseen unstructured environments)** 中难以预测所有特定危险的问题
- 现有使用**视觉语言模型(Vision-Language Model, VLM)** 的方法虽能预判常识性危险,但无法捕获**交互和具身依赖的逆境(interaction and embodiment-dependent adversities)**
- 研究背景:自主移动机器人需要在野外持续运行,但未知危险使得传统预先枚举方法失效
- 提出**“别愚弄我两次”(Don't Fool Me Twice)** 持续学习框架,让机器人在线从干扰中学习
- 首先**观察干扰并描述其效果**,结合视觉上下文查询**视觉语言模型(VLM)** 预测可能的原因
- 使用**核回归(kernel regression)** 对局部干扰进行**少样本(few-shot)** 建模,高效刻画瞬态异常
- 利用**语义体素中心建模(semantic voxel-centric modeling)** 估计**认知不确定性(epistemic uncertainty)**,将交互驱动干扰视为可学习的空间行为以支持下游恢复
- **首个持续学习框架** 使机器人能在线适应未知逆境,通过语义归因异常行为,避免重复犯错
- **结合VLM与核回归**:利用VLM的常识推理能力预测原因,再用核回归少样本建模瞬态异常,实现高效适配
- **语义体素中心不确定性估计**:打破传统方法将干扰视为静态噪声的局限,将其建模为可学习的空间行为,提升恢复效率
- **跨具身(cross-embodiment)验证**:在仿真和硬件上测试多种机器人和逆境模式,证明框架的通用性
- 为**野外持续学习(continual learning in the wild)** 提供了新颖范式,使机器人能够自主适应未知逆境
- 提出四个假设并在仿真和硬件上验证,为后续研究提供可复用的实验依据
- 显著提升了机器人在**复杂非结构化环境** 中的鲁棒性和自适应能力,推动具身智能体迈向实际部署