← 返回论文列表

费雪保持引导:用于安全扩散控制的无需训练流形约束
Fisher-Preserving Guidance: Training-Free Manifold Constraints for Safe Diffusion Control

作者: Hao Ren, Zetong Bi, Yiming Zeng 等8人
arXiv: 2605.29937v1
分类: cs.RO, cs.LG
📝 论文摘要
扩散模型在视觉导航中的航路点预测方面表现有效,但标准采样和测试时指导方法在更新偏离训练流形时可能产生不可靠或低效的轨迹。我们提出了一种无需训练的推理方法——外积张成投影下的Fisher保持引导,该方法在优化任务目标的同时,避免与分布外动作相关的较大Fisher漂移。我们的方法通过低秩雅可比分解计算Fisher保持更新,每步只需一次反向传播,可实现实时应用。进一步,我们引入截断Fisher去噪敏感度作为不确定性信号,并将其用于鲁棒的多样本动作融合。在玩具模型和真实导航基准上的实验——包括基于TSDF指导的Maze2D、使用官方扩散策略权重的PushT、以及仿真和真实机器人上的视觉导航——表明,该方法在无需额外训练的情况下,相较于强扩散策略基线具有一致性的性能提升。

📊 核心分析

🎯 研究动机
- 扩散模型在视觉导航的航点预测中有效,但标准采样和测试时引导(training-free guidance)产生的轨迹可能因更新偏离训练流形而变得不可靠或低效 - 现有方法在优化任务目标时,缺乏对分布外(out-of-distribution)动作的约束,导致Fisher漂移(Fisher drift)较大 - 研究背景:扩散策略(diffusion policy)在机器人操控和导航中广泛应用,但推理时如何保持生成轨迹在数据流形内同时满足任务目标是一个挑战
🔧 核心方法
- 提出**Fisher保持引导与外积跨度投影(Fisher Preserving Guidance with Outer Product Span Projection)**,一种免训练的推理方法,通过低秩Jacobian分解计算Fisher保持更新,每步仅需一次反向传播 - 引入**截断Fisher去噪敏感性(Truncated Fisher Denoising Sensitivity)** 作为不确定性信号,用于鲁棒的多样本动作融合(multi-sample action blending) - 方法在每一步迭代中通过外积跨度投影(outer product span projection)约束更新方向,避免大Fisher漂移,同时优化任务目标函数
💡 核心创新
- **首创性**:首次将Fisher信息(Fisher information)与流形约束结合到扩散模型的测试时引导中,无需额外训练即可保持生成轨迹在训练流形内 - **高效计算**:通过低秩Jacobian分解将每步计算简化为单次反向传播,实现实时推理,显著优于需要多步或训练的方法 - **不确定性感知**:提出截断Fisher去噪敏感性作为新的不确定性度量,用于鲁棒融合多个候选动作,提升轨迹可靠性
🏆 总体贡献
- 为扩散模型在视觉导航和控制中提供了一种**免训练、实时、保持流形约束** 的引导框架,提升了安全性和效率 - 在多个基准(Maze2D、PushT、仿真及真实机器人视觉导航)上一致优于强扩散策略基线,且无需额外训练 - 开源了代码和方法,为机器人学习和控制领域的在线引导(online guidance)与不确定性估计提供了新思路