该论文旨在解决自动驾驶中3D语义占据预测(3D semantic occupancy prediction)面临的两个关键问题:
- 长尾类别偏差(long-tailed class bias):模型对罕见类别识别能力不足
- 分布外(out-of-distribution, OOD)输入处理:现有方法容易将异常输入过度自信地分配给罕见类别,存在安全隐患
论文提出了ProOOD方法,这是一个轻量级即插即用(plug-and-play)框架,包含三个核心技术组件:
- 原型引导的语义填补(prototype-guided semantic imputation):用类别一致的特征填充被遮挡区域
- 原型引导的尾部挖掘(prototype-guided tail mining):增强罕见类别的表征,防止OOD样本被错误吸收
- EchoOOD评分模块:融合局部逻辑一致性(local logit coherence)与局部/全局原型匹配(local and global prototype matching),生成可靠的体素级(voxel-level) OOD分数
论文的核心创新点体现在三个方面:
- 首次将原型学习(prototype learning)系统性地应用于3D占据预测的OOD检测问题,通过原型引导同时改善长尾分布和OOD检测
- 提出了EchoOOD这一训练免费(training-free)的OOD评分机制,无需额外训练即可融合多尺度原型匹配信息
- 设计了端到端的轻量级框架,能够即插即用地提升现有3D占据预测模型的校准性(calibration)和OOD检测能力,在保持高效的同时显著提升罕见类别性能和异常检测精度
论文对该领域的整体贡献包括:
- 在五个基准数据集上实现了最先进的(state-of-the-art)性能,在SemanticKITTI上整体mIoU提升+3.57%,尾部类别mIoU提升+24.80%
- 在VAA-KITTI上将AuPRCr指标提升了19.34个百分点,显著改善了OOD检测能力
- 为安全关键的城市场景驾驶提供了更校准的占据估计和更可靠的OOD检测方案
- 公开了源代码,促进了该领域的研究和应用发展