CANMOT：自动驾驶中多目标跟踪的类别感知噪声建模

📝 论文摘要

基于卡尔曼滤波（KF）的多目标跟踪（MOT）因其强大的性能、计算效率和可解释性，仍是自动驾驶领域的一项强基准方法。在多数实际系统中，过程噪声和测量噪声协方差被全局定义并在不同对象类别间共享，这预设了异质交通参与者之间具有相同的不确定性特征。本研究重新审视了这一假设，并提出CANMOT——一种面向基于KF的3D MOT的类别感知和对象对齐噪声建模框架。引入类别特定的对角过程协方差和测量协方差矩阵，并可选择在对象坐标系下表达以保持纵横向各向异性。在nuScenes基准上的系统实验表明，与现有技术（SotA）相比，类别感知和对象对齐的噪声建模提升了跟踪性能，并显著降低了身份切换次数。此外，利用平均归一化估计误差平方（ANEES）和基于$\chi^2$的违例测试分析了估计不确定性的一致性。结果揭示标准基于KF的MOT基准存在严重过度自信。虽然所提出的公式在不修改底层滤波框架的情况下改善了校准，但仍表现出显著的不一致性，凸显了该领域进一步研究的必要性。代码可在https://github.com/rst-tu-dortmund/learned-3d-nms获取。

🎯 研究动机

- 现有基于**卡尔曼滤波(Kalman filter, KF)** 的多目标跟踪(MOT)在自动驾驶中假设所有物体类别共享相同的**过程噪声(process noise)** 和**测量噪声(measurement noise)** 协方差，忽略了不同交通参与者的不确定性差异 - 这种全局噪声建模方式无法准确反映异质交通参与者（如行人、车辆）的不同运动特性和感知误差 - 研究背景：KF-based MOT因高性能、计算效率和可解释性仍是自动驾驶的强基线，但噪声协方差的统一假设限制了其校准能力

🔧 核心方法

- 提出**CANMOT** 框架，一种**类感知(class-aware)** 和**对象对齐(object-aligned)** 的噪声建模方法，用于基于KF的3D MOT - 为每个物体类别引入**类特定的对角过程协方差和对角测量协方差矩阵**，替代全局共享的固定协方差 - 可选地将噪声协方差矩阵定义在**物体坐标系(object coordinate frame)** 中，以保留纵向-横向各向异性(longitudinal-lateral anisotropy) - 在**nuScenes** 基准上进行系统实验，并使用**平均归一化估计误差平方(Average Normalized Estimation Error Squared, ANEES)** 和**卡方检验(χ²-based violation tests)** 分析不确定性校准

💡 核心创新

- **类感知噪声建模**：首次在KF-based MOT中为不同物体类别分别学习**过程噪声协方差** 和**测量噪声协方差**，突破传统全局共享假设 - **对象对齐表示**：将噪声协方差矩阵表达在物体坐标系中，使纵向和横向的不确定性解耦，适应不同运动朝向 - **不确定性校准分析**：使用ANEES和卡方检验系统性地揭示标准KF-based MOT存在的**过度自信(overconfidence)** 问题，并提出改进校准方案 - 无需修改底层滤波框架即可改善不确定性校准，这是与依赖复杂网络或学习滤波器的现有方法的不同之处

🏆 总体贡献

- 为自动驾驶中的多目标跟踪提供了一种新颖的**类感知与对象对齐噪声建模范式**，在不增加计算开销的情况下提升跟踪性能 - 在**nuScenes** 基准上显著减少**身份切换(identity switches)**，相比当前最先进方法取得改进 - 通过不确定性校准分析，揭示了标准KF-based MOT的**过度自信** 问题，并指明未来研究方向（仍需进一步研究以提高一致性） - 开源代码（https://github.com/rst-tu-dortmund/learned-3d-nms）促进社区复现与后续研究

CANMOT：自动驾驶中多目标跟踪的类别感知噪声建模
CANMOT：自动驾驶中多目标跟踪的类别感知噪声建模

📊 核心分析

CANMOT：自动驾驶中多目标跟踪的类别感知噪声建模 CANMOT：自动驾驶中多目标跟踪的类别感知噪声建模

📊 核心分析

CANMOT：自动驾驶中多目标跟踪的类别感知噪声建模
CANMOT：自动驾驶中多目标跟踪的类别感知噪声建模