← 返回论文列表

用于汽车弱势道路使用者安全的边缘AI:基于知识蒸馏的可部署检测
Edge AI for Automotive Vulnerable Road User Safety: Deployable Detection via Knowledge Distillation

作者: Akshay Karjol, Darrin M. Hanna
arXiv: 2604.26857v1
分类: cs.CV, cs.LG, cs.RO, eess.IV
📝 论文摘要
在边缘硬件上部署针对弱势道路使用者(VRU)安全的精准目标检测,需要在模型能力与计算约束之间取得平衡。大模型虽精度高,但在边缘部署所需的INT8量化条件下表现不佳,而小模型则牺牲了检测性能。本文提出一种知识蒸馏(KD)框架,训练轻量级YOLOv8-S学生模型(1120万参数)模仿YOLOv8-L教师模型(4370万参数),在保持量化鲁棒性的同时实现了3.9倍压缩。我们在完整版BDD100K数据集(7万张训练图像)上采用训练后INT8量化进行评估。教师模型在INT8条件下性能严重下降(mAP下降23%),而KD学生模型仍保持精度(mAP仅下降5.6%)。分析表明,知识蒸馏传递的是精度校准能力而非原始检测能力:在INT8条件下,KD学生模型的精确率达0.748,而直接训练模型仅为0.653,在同等召回率下提升14.5%,相较于失效的教师模型减少44%的误报。在INT8条件下,KD学生模型以3.9倍更小的体积超越了教师模型在FP32下的精确率(0.748对比0.718)。这些发现确立了知识蒸馏作为在边缘硬件上部署精准、安全关键的VRU检测的必要条件。

📊 核心分析

🎯 研究动机
- 在**边缘硬件(edge hardware)** 上部署**弱势道路使用者(Vulnerable Road User, VRU)** 安全检测需要平衡模型容量与计算约束 - 大模型(如YOLOv8-L)精度高,但在边缘部署所需的**INT8量化(INT8 quantization)** 下性能严重下降(mAP下降23%) - 小模型虽然能适应INT8,但牺牲了检测性能,无法满足安全关键场景的准确性要求
🔧 核心方法
- 提出**知识蒸馏(knowledge distillation, KD)** 框架,训练紧凑的**YOLOv8-S学生模型(student)** (11.2M参数)模仿**YOLOv8-L教师模型(teacher)** (43.7M参数) - 使用**全尺度BDD100K数据集** (70K训练图像)进行评估,并采用**训练后量化(Post-Training Quantization, PTQ)** 到INT8 - 分析表明KD传递的是**精度校准(precision calibration)** 而非原始检测能力:KD学生在INT8下精确率0.748,直接训练仅为0.653,在同等召回率下提升14.5%
💡 核心创新
- **量化鲁棒性迁移**:首次发现知识蒸馏能够将教师模型的**量化鲁棒性(quantization robustness)** 迁移给学生,而非仅仅提升原始检测精度 - **远超教师FP32性能**:在INT8量化下,KD学生模型(3.9倍压缩)的精确率(0.748)超过了教师模型的FP32精度(0.718),实现了**精度与压缩兼得** - **误报大幅降低**:相比崩溃的教师INT8模型,KD学生减少**44%的误报(false alarms)**,对安全关键VRU检测至关重要
🏆 总体贡献
- 确立了**知识蒸馏(knowledge distillation)** 作为在边缘硬件上部署精确、安全关键的**VRU检测(VRU detection)** 的必要条件 - 提供了一种**3.9倍压缩** 且保持量化鲁棒性的实用方法,为边缘AI安全应用铺平道路 - 通过大规模实验揭示了量化下知识蒸馏的**精度校准机制**,为后续研究提供了理论基础