用于汽车弱势道路使用者安全的边缘AI：基于知识蒸馏的可部署检测

📝 论文摘要

在边缘硬件上部署针对弱势道路使用者（VRU）安全的精准目标检测，需要在模型能力与计算约束之间取得平衡。大模型虽精度高，但在边缘部署所需的INT8量化条件下表现不佳，而小模型则牺牲了检测性能。本文提出一种知识蒸馏（KD）框架，训练轻量级YOLOv8-S学生模型（1120万参数）模仿YOLOv8-L教师模型（4370万参数），在保持量化鲁棒性的同时实现了3.9倍压缩。我们在完整版BDD100K数据集（7万张训练图像）上采用训练后INT8量化进行评估。教师模型在INT8条件下性能严重下降（mAP下降23%），而KD学生模型仍保持精度（mAP仅下降5.6%）。分析表明，知识蒸馏传递的是精度校准能力而非原始检测能力：在INT8条件下，KD学生模型的精确率达0.748，而直接训练模型仅为0.653，在同等召回率下提升14.5%，相较于失效的教师模型减少44%的误报。在INT8条件下，KD学生模型以3.9倍更小的体积超越了教师模型在FP32下的精确率（0.748对比0.718）。这些发现确立了知识蒸馏作为在边缘硬件上部署精准、安全关键的VRU检测的必要条件。

🎯 研究动机

- 在**边缘硬件(edge hardware)** 上部署**弱势道路使用者(Vulnerable Road User, VRU)** 安全检测需要平衡模型容量与计算约束 - 大模型（如YOLOv8-L）精度高，但在边缘部署所需的**INT8量化(INT8 quantization)** 下性能严重下降（mAP下降23%） - 小模型虽然能适应INT8，但牺牲了检测性能，无法满足安全关键场景的准确性要求

🔧 核心方法

- 提出**知识蒸馏(knowledge distillation, KD)** 框架，训练紧凑的**YOLOv8-S学生模型(student)** （11.2M参数）模仿**YOLOv8-L教师模型(teacher)** （43.7M参数） - 使用**全尺度BDD100K数据集** （70K训练图像）进行评估，并采用**训练后量化(Post-Training Quantization, PTQ)** 到INT8 - 分析表明KD传递的是**精度校准(precision calibration)** 而非原始检测能力：KD学生在INT8下精确率0.748，直接训练仅为0.653，在同等召回率下提升14.5%

💡 核心创新

- **量化鲁棒性迁移**：首次发现知识蒸馏能够将教师模型的**量化鲁棒性(quantization robustness)** 迁移给学生，而非仅仅提升原始检测精度 - **远超教师FP32性能**：在INT8量化下，KD学生模型（3.9倍压缩）的精确率（0.748）超过了教师模型的FP32精度（0.718），实现了**精度与压缩兼得** - **误报大幅降低**：相比崩溃的教师INT8模型，KD学生减少**44%的误报(false alarms)**，对安全关键VRU检测至关重要

🏆 总体贡献

- 确立了**知识蒸馏(knowledge distillation)** 作为在边缘硬件上部署精确、安全关键的**VRU检测(VRU detection)** 的必要条件 - 提供了一种**3.9倍压缩** 且保持量化鲁棒性的实用方法，为边缘AI安全应用铺平道路 - 通过大规模实验揭示了量化下知识蒸馏的**精度校准机制**，为后续研究提供了理论基础

用于汽车弱势道路使用者安全的边缘AI：基于知识蒸馏的可部署检测
Edge AI for Automotive Vulnerable Road User Safety: Deployable Detection via Knowledge Distillation

📊 核心分析

用于汽车弱势道路使用者安全的边缘AI：基于知识蒸馏的可部署检测 Edge AI for Automotive Vulnerable Road User Safety: Deployable Detection via Knowledge Distillation

📊 核心分析

用于汽车弱势道路使用者安全的边缘AI：基于知识蒸馏的可部署检测
Edge AI for Automotive Vulnerable Road User Safety: Deployable Detection via Knowledge Distillation