该论文旨在解决自动驾驶中安全且可解释的运动规划(motion planning)这一核心挑战。研究背景是:基于规则(rule-based)的规划器虽然行为可预测且可解释,但难以处理真实交通的复杂性和不确定性;而基于学习(learned)的规划器虽然适应性强,但透明度低且偶发安全违规。
论文提出了一个名为Mosaic的可扩展框架,其核心方法是:
- 通过仲裁图(arbitration graphs)将基于规则和基于学习的规划器集成到一个结构化决策框架中。
- 将轨迹验证(trajectory verification)和评分(scoring)与各个规划器的轨迹生成过程解耦(decoupling)。
- 在更高层级进行轨迹验证,在规划器之间引入冗余(redundancy),仅在所有规划器都未能生成有效轨迹时才触发紧急制动(emergency braking)。
- 通过统一的评分和最优轨迹选择(optimal trajectory selection),结合两类规划器的互补优势。
论文的核心创新点在于:
- 提出了一个新颖的、可扩展的框架,首次通过仲裁图(arbitration graphs)实现了基于规则和基于学习的运动规划器的结构化、透明化集成。
- 通过将轨迹验证和评分与轨迹生成解耦,使得每个决策都变得透明(transparent)和可追溯(traceable),解决了学习型规划器“黑箱”问题。
- 高层级的验证机制创造了规划器间的冗余,将安全关键(safety-critical)的紧急制动限制在极端情况,显著提升了系统的整体鲁棒性(robustness)。
- 该框架无需重新训练(retraining)或额外数据,即可动态组合不同规划器,实现性能的即时提升。
论文对该领域的总体贡献是:
- 提出了Mosaic框架,为结合可解释的规则系统与强大的学习系统提供了一个通用、可扩展的解决方案。
- 在nuPlan基准测试中取得了新的最先进(state-of-the-art)性能(Val14闭环基准测试95.48 CLS-NR和93.98 CLS-R),并将责任碰撞(at-fault collisions)减少了30%。
- 在高度交互的困难场景(interPlan基准测试)中,性能比其最佳组成规划器提升了23.3%(54.30 CLS-R),证明了框架在复杂场景下的有效性。
- 开源了代码,为社区提供了研究与实践工具。