← 返回论文列表

CANMOT:自动驾驶中多目标跟踪的类别感知噪声建模
CANMOT:自动驾驶中多目标跟踪的类别感知噪声建模

作者: Timo Osterburg, Stefan Schütte, Torsten Bertram
arXiv: 2606.03590v1
分类: cs.RO
📝 论文摘要
基于卡尔曼滤波(KF)的多目标跟踪(MOT)因其强大的性能、计算效率和可解释性,仍是自动驾驶领域的一项强基准方法。在多数实际系统中,过程噪声和测量噪声协方差被全局定义并在不同对象类别间共享,这预设了异质交通参与者之间具有相同的不确定性特征。 本研究重新审视了这一假设,并提出CANMOT——一种面向基于KF的3D MOT的类别感知和对象对齐噪声建模框架。引入类别特定的对角过程协方差和测量协方差矩阵,并可选择在对象坐标系下表达以保持纵横向各向异性。 在nuScenes基准上的系统实验表明,与现有技术(SotA)相比,类别感知和对象对齐的噪声建模提升了跟踪性能,并显著降低了身份切换次数。此外,利用平均归一化估计误差平方(ANEES)和基于$\chi^2$的违例测试分析了估计不确定性的一致性。结果揭示标准基于KF的MOT基准存在严重过度自信。虽然所提出的公式在不修改底层滤波框架的情况下改善了校准,但仍表现出显著的不一致性,凸显了该领域进一步研究的必要性。 代码可在https://github.com/rst-tu-dortmund/learned-3d-nms获取。

📊 核心分析

🎯 研究动机
- 现有基于**卡尔曼滤波(Kalman filter, KF)** 的多目标跟踪(MOT)在自动驾驶中假设所有物体类别共享相同的**过程噪声(process noise)** 和**测量噪声(measurement noise)** 协方差,忽略了不同交通参与者的不确定性差异 - 这种全局噪声建模方式无法准确反映异质交通参与者(如行人、车辆)的不同运动特性和感知误差 - 研究背景:KF-based MOT因高性能、计算效率和可解释性仍是自动驾驶的强基线,但噪声协方差的统一假设限制了其校准能力
🔧 核心方法
- 提出**CANMOT** 框架,一种**类感知(class-aware)** 和**对象对齐(object-aligned)** 的噪声建模方法,用于基于KF的3D MOT - 为每个物体类别引入**类特定的对角过程协方差和对角测量协方差矩阵**,替代全局共享的固定协方差 - 可选地将噪声协方差矩阵定义在**物体坐标系(object coordinate frame)** 中,以保留纵向-横向各向异性(longitudinal-lateral anisotropy) - 在**nuScenes** 基准上进行系统实验,并使用**平均归一化估计误差平方(Average Normalized Estimation Error Squared, ANEES)** 和**卡方检验(χ²-based violation tests)** 分析不确定性校准
💡 核心创新
- **类感知噪声建模**:首次在KF-based MOT中为不同物体类别分别学习**过程噪声协方差** 和**测量噪声协方差**,突破传统全局共享假设 - **对象对齐表示**:将噪声协方差矩阵表达在物体坐标系中,使纵向和横向的不确定性解耦,适应不同运动朝向 - **不确定性校准分析**:使用ANEES和卡方检验系统性地揭示标准KF-based MOT存在的**过度自信(overconfidence)** 问题,并提出改进校准方案 - 无需修改底层滤波框架即可改善不确定性校准,这是与依赖复杂网络或学习滤波器的现有方法的不同之处
🏆 总体贡献
- 为自动驾驶中的多目标跟踪提供了一种新颖的**类感知与对象对齐噪声建模范式**,在不增加计算开销的情况下提升跟踪性能 - 在**nuScenes** 基准上显著减少**身份切换(identity switches)**,相比当前最先进方法取得改进 - 通过不确定性校准分析,揭示了标准KF-based MOT的**过度自信** 问题,并指明未来研究方向(仍需进一步研究以提高一致性) - 开源代码(https://github.com/rst-tu-dortmund/learned-3d-nms)促进社区复现与后续研究