- 现有基于激光雷达(LiDAR)的3D目标检测中,后处理阶段使用启发式的**非极大值抑制(NMS)** 方法,无法有效处理密集重叠的候选框
- 启发式NMS缺乏对检测间关系的建模,导致在小物体和罕见类别上性能不佳
- 需要一种可学习的、原则性的替代方案来提升检测后处理的可靠性和一致性
- 提出**D2D-Rescore** 模块,采用**Transformer** 架构实现检测-检测之间的注意力(detection-to-detection attention)机制
- 提出**GossipNet3D** 模块,将2D的GossipNet概念扩展到3D,通过**鸟瞰图(Bird's-Eye View, BEV)** 中的局部消息传递进行检测过滤
- 设计**度量感知匹配策略(metric-aware matching strategy)**,与nuScenes评估协议对齐,确保训练和验证行为一致
- **首次** 将学习型过滤模块替代启发式NMS,利用检测间关系(transformer注意力或消息传递)进行后处理
- **端到端可学习**:通过数据驱动的方式优化过滤过程,无需修改基础检测网络
- **度量感知训练**:匹配策略与评估指标对齐,提升mAP、NDS和真阳性质量,尤其在**小和罕见类别** 上效果显著
- **低计算开销**:在提升性能的同时仅增加极小的计算成本,保持高效推理
- 为3D目标检测提供了一种**可学习后处理范式**,替代传统启发式NMS,提升了检测可靠性
- 在nuScenes基准上取得了更优的**平均精度(mAP)** 和**检测分数(NDS)**,特别是在小物体和罕见类别上
- 代码开源,促进了社区对学习型NMS方法的复现与后续研究
- 展示了检测级学习过滤可以**即插即用** 地增强现有3D检测器,无需修改基础网络架构