该论文旨在解决现有开环端到端神经运动规划器(open-loop end-to-end neural motion planners)的两个主要局限性:
- 现有方法通常为给定工作空间只生成单一路径,无法捕捉任务固有的多模态性(multi-modality)。
- 现有方法未能充分利用其开环结构进行推理时优化(inference-time optimization)。
论文提出了流运动策略(Flow Motion Policy),这是一个用于机器人操作臂的开环端到端神经运动规划器。其核心方法是:
- 利用流匹配模型(flow matching models)的随机生成式公式(stochastic generative formulation)来建模可行路径的分布。
- 通过推理时最佳N采样(inference-time best-of-N sampling)机制:生成多个端到端候选路径,规划后评估其碰撞状态,并执行第一个无碰撞解。
论文的核心创新点在于:
- **将流匹配(flow matching)的生成式建模能力引入运动规划**:首次利用流匹配模型来显式地捕捉规划数据集中固有的多模态性,从而能够生成多样化的可行路径分布。
- **设计了高效的推理时优化框架**:通过“生成-评估-选择”的流水线,将开环规划器的输出与简单的碰撞状态评估相结合,实现了无需特权碰撞检查器(privileged collision checker)的高效多方案择优。
- **实现了随机生成式策略(stochastic generative policies)在端到端运动规划中的应用**:与只能输出单一路径的确定性方法相比,该方法通过建模分布支持推理时的灵活采样与优化。
论文对该领域的总体贡献包括:
- 提出了一种新颖的、基于流匹配的神经运动规划器,在规划成功率和效率上优于代表性的基于采样(sampling-based)和神经运动规划方法。
- 实证了随机生成式策略在端到端运动规划及推理时优化中的有效性,为处理规划多模态性问题提供了新思路。
- 提供了一种无需依赖规划期间特权信息的开环规划框架,更贴近实际机器人应用场景。