- 扩散模型在视觉导航的航点预测中有效,但标准采样和测试时引导(training-free guidance)产生的轨迹可能因更新偏离训练流形而变得不可靠或低效
- 现有方法在优化任务目标时,缺乏对分布外(out-of-distribution)动作的约束,导致Fisher漂移(Fisher drift)较大
- 研究背景:扩散策略(diffusion policy)在机器人操控和导航中广泛应用,但推理时如何保持生成轨迹在数据流形内同时满足任务目标是一个挑战
- 提出**Fisher保持引导与外积跨度投影(Fisher Preserving Guidance with Outer Product Span Projection)**,一种免训练的推理方法,通过低秩Jacobian分解计算Fisher保持更新,每步仅需一次反向传播
- 引入**截断Fisher去噪敏感性(Truncated Fisher Denoising Sensitivity)** 作为不确定性信号,用于鲁棒的多样本动作融合(multi-sample action blending)
- 方法在每一步迭代中通过外积跨度投影(outer product span projection)约束更新方向,避免大Fisher漂移,同时优化任务目标函数
- **首创性**:首次将Fisher信息(Fisher information)与流形约束结合到扩散模型的测试时引导中,无需额外训练即可保持生成轨迹在训练流形内
- **高效计算**:通过低秩Jacobian分解将每步计算简化为单次反向传播,实现实时推理,显著优于需要多步或训练的方法
- **不确定性感知**:提出截断Fisher去噪敏感性作为新的不确定性度量,用于鲁棒融合多个候选动作,提升轨迹可靠性
- 为扩散模型在视觉导航和控制中提供了一种**免训练、实时、保持流形约束** 的引导框架,提升了安全性和效率
- 在多个基准(Maze2D、PushT、仿真及真实机器人视觉导航)上一致优于强扩散策略基线,且无需额外训练
- 开源了代码和方法,为机器人学习和控制领域的在线引导(online guidance)与不确定性估计提供了新思路