- 无人机(UAV)目标检测面临严重**自运动(ego-motion)**、**相机抖动(camera jitter)** 和**尺度变化(scale variation)** 的挑战
- 现有静态图像检测器直接应用于无人机视频时效果不佳,尤其对**动态场景中的小目标(small objects)** 失效
- 基于运动的方法存在局限:**光流(optical flow)** 计算代价高,**单间隔差分(single-interval differencing)** 对抖动敏感且无法捕捉多样化运动模式
- 提出**视觉-only运动引导检测框架(vision-only motion-guided detection framework)**,通过**全局运动补偿(Global Motion Compensation, GMC)** 基于单应性(homography)对齐相邻帧
- 设计**双间隔运动提取策略(Dual-Interval Motion Extraction)**,同时捕获**短期(short-term)** 和**长期(long-term)** 运动线索
- 引入**轻量运动引导注意力模块(Motion-Guided Attention, MGA)**,在**特征金字塔网络(Feature Pyramid Network)** 中增强运动相关特征表示
- **首次将自运动解耦与双间隔运动线索结合**:通过GMC消除相机干扰,并利用双间隔提取区分目标动态与噪声
- **轻量注意力机制**:MGA模块仅增加少量计算开销,即可有效聚焦运动区域,优于传统光流或单差分方法
- **针对无人机场景的鲁棒设计**:在严重自运动和抖动条件下仍能稳定提升YOLOv8基线性能,无需额外传感器信息
- 为**无人机视频目标检测(UAV video object detection)** 提供了一种高效的运动引导范式,显著缓解**自运动与抖动干扰**
- 在**VisDrone-VID** 数据集上验证,相比强基线YOLOv8获得**一致改进(consistent improvements)**
- 通过消融实验证实了**双间隔设计** 和**运动引导注意力机制** 的有效性,为后续研究提供可复现的基线