- 现有将人类偏好纳入**自主移动机器人(AMR)** 路径规划的传统方法依赖复杂的**奖励工程(reward engineering)** 或硬件密集型解决方案
- 基于**模仿学习(imitation learning)** 的最前沿框架存在两个关键局限:对未知环境的**泛化能力(generalization)** 有限,以及**演示收集(demonstration collection)** 的鲁棒性低
- 研究背景:需要一种既能融入人类偏好、又能在未见环境中保持鲁棒性且轻量级的路径规划方法
- 提出**SPADE框架**,核心包含两个组件:一个基于**ROS 2** 重构的**标注工具(annotation tool)**,以及一种**扩散增强(diffusion-based augmentation)** 训练策略
- 将**扩散模型(diffusion model)** 引入**行为克隆(behavioral cloning)** 基线模型,通过扩散增强生成多样化的路径示例
- 提供**专家演示数据集(expert demonstration dataset)**,并通过**消融研究(ablation study)** 评估方法鲁棒性
- 模型具有极少的可训练参数(较SOTA减少93.8%)
- **首创性**:首次将**扩散增强(diffusion-based augmentation)** 与行为克隆结合用于路径规划,解决泛化与鲁棒性瓶颈
- **轻量高效**:在降低**绝对位姿误差(APE)** 39.1%和**Fréchet Inception Distance(FID)** 33.5%的同时,可训练参数减少93.8%
- **实用工具贡献**:提供基于**ROS 2** 的全新标注工具,降低演示收集门槛
- **平衡性能**:达到**扩散级别(diffusion-level)** 的泛化能力,同时保留**实时(real-time)** 和**边缘部署(on-edge)** 特性
- 为**自主移动机器人(AMR)** 路径规划提供了一种新颖的**扩散增强模仿学习** 范式,显著提升泛化性与鲁棒性
- 在标准基准上以更少参数实现SOTA性能(APE降低39.1%,FID降低33.5%)
- 开源基于ROS 2的标注工具和专家演示数据集,促进社区复现与后续研究