← 返回论文列表

状态与动态物体预测不确定性下的机会约束MPPI及碰撞风险校准评估
Chance-Constrained MPPI under State and Dynamic Object Prediction Uncertainty and the Evaluation of Collision Risk Calibration

作者: Benjamin Serfling, Konrad Doll, Kati Radkhah-Lens
arXiv: 2605.28330v1
分类: cs.RO
📝 论文摘要
采用机会约束的模型预测路径积分(MPPI)控制在动态环境导航中日益普及,以显式界定碰撞风险。然而,这些概率性保证隐含假设来自定位和感知的上游不确定性已得到良好校准。实践中,估计器常存在失校准问题,从而引发特有的闭环失效模式:过度自信导致系统性安全违规,而信心不足则触发过度保守的冻结操作或概率稀释。为弥补这一关键缺口,我们的首要贡献是提出一种严格的评估方法论,运用适当评分规则评估闭环执行过程中预测碰撞风险的统计有效性。同时,提出双不确定性机会约束管状MPPI(DUCCT-MPPI)作为实时风险感知规划架构。DUCCT-MPPI通过单管无迹变换(UT)近似联合集成定位不确定性,并通过蒙特卡罗聚合实现动态障碍物预测不确定性集成。基于大量物理仿真,该框架展现出稳健的失效缓解能力,能在高杂乱环境中无缝过渡至安全保守的机动操作而不陷入功能死锁。在高杂乱环境中,DUCCT-MPPI实现了卓越的鲁棒性,导航成功率较经典蒙特卡罗MPPI基线提升近28%,同时创下最低行驶时间并最小化引发的社会力。最终,这些发现证实:自主导航中可靠的概率安全性不仅需要表达力强的风险模型,更要求贯穿整个自主堆栈的统计有效的不确定性估计。

📊 核心分析

🎯 研究动机
- 解决**机会约束MPPI(Chance-Constrained MPPI)** 在实际动态导航中因定位和感知不确定性校准不良而导致的**过自信(overconfidence)** (安全违规)或**欠自信(underconfidence)** (保守冻结/概率稀释)问题 - 现有机会约束方法隐式假设上游不确定性(定位与感知)已被良好校准,但实际估计器常存在**校准偏差(miscalibration)**,引发闭环故障模式 - 研究背景:概率安全保证需要整个自主栈的不确定性估计具备统计有效性,而现有工作缺乏对此的系统性评估与鲁棒规划方案
🔧 核心方法
- 提出**DUCCT-MPPI(Dual-Uncertainty Chance-Constrained Tube MPPI)** 实时风险感知规划架构,联合考虑**定位不确定性(localization uncertainty)** 和**动态障碍物预测不确定性(dynamic obstacle prediction uncertainty)** - 使用**单管无迹变换(one-tube Unscented Transform, UT)** 近似来集成定位不确定性,通过**蒙特卡洛聚合(Monte Carlo aggregation)** 集成动态障碍物预测不确定性 - 引入**适当评分规则(proper scoring rules)** 作为评估方法论,在闭环执行中严格评价碰撞风险预测的统计有效性(校准性)
💡 核心创新
- **首次联合建模**:在机会约束MPPI框架中同时处理**状态不确定性(state uncertainty)** 和**动态目标预测不确定性(prediction uncertainty)**,而非仅考虑其中之一 - **实用近似方法**:提出**一管UT近似** 以实现定位不确定性的实时集成,结合**蒙特卡洛聚合** 处理预测不确定性的高维分布,兼顾计算效率与精度 - **校准评估范式**:将**适当评分规则** 引入碰撞风险校准评价,为自主导航的概率安全验证提供了严格统计工具,填补了现有方法仅依赖经验性能的空白
🏆 总体贡献
- 建立了一套评估**碰撞风险校准(collision risk calibration)** 的严格方法论,推动自主导航概率安全从“表达性风险模型”迈向“统计有效不确定性估计” - 提出**DUCCT-MPPI** 实时规划框架,在高度杂乱环境中相比标准**蒙特卡洛MPPI(Monte Carlo MPPI)** 基线提升**导航成功率28%**,同时实现**最低旅行时间** 和**最小化诱导社会力(induced social forces)** - 通过仿真验证了如何通过鲁棒不确定性集成避免过自信和欠自信的故障模式,为实际部署中的安全关键决策提供理论依据