- 研究背景:开放词汇具身智能代理日益依赖**视觉-语言模型(vision-language model)** 如CLIP进行物体感知和任务基础,但其共享嵌入空间对**文字攻击(typographic attacks)** 存在结构性脆弱性
- 现有工作仅在静态2D基准和3D导航任务中量化了文字攻击的威胁,尚未研究其对完整家庭机器人操控的**感知-规划-行动(Sense-Plan-Act)** 流水线的影响
- 需要评估文字攻击在真实物理机器人操控场景中是否会产生可度量的、物理上可执行的故障行为
- 在基于**Habitat** 模拟器的**HomeRobot** 基准中进行评估,构建了59个可归因的episodes作为受控测试池
- 提出一个**解耦感知架构(decoupled perception architecture)**,该架构暴露一个冻结的**CLIP编码器** 以接受对抗性贴纸,同时通过**DETIC** 保持几何定位
- 攻击设置:在不受控的视角和遮挡条件下,不对感知进行优化,直接评估攻击效果
- **首次** 将文字攻击威胁引入完整的家庭机器人操控流水线,评估了从感知到物理执行的全链路影响
- 发现感知误差会通过持久**3D语义地图(3D semantic map)** 传播,产生**运动失败(kinetic failures)**,即机器人物理抓取并运送错误物体到目标容器
- 证明了文字攻击是一种**真实、可测量且物理上可造成后果** 的威胁,超越了先前研究仅停留在感知误分类层面的分析
- 揭示了**文字误分类(typographic misclassification)** 对模块化操控流水线安全的严重威胁,填补了先前文字攻击研究未涉及物理执行后果的空白
- 在标准基准上量化了攻击成功率(整体ASR 67.8%,完全成功episodes中达70.0%),为后续防御研究提供了基线
- 建立了一种可复现的评估框架(Habitat+HomeRobot+解耦架构),推动了具身AI安全性领域的研究