← 返回论文列表

通过双间隔运动线索将自身运动与目标动态解耦以实现无人机检测
Decoupling Ego-Motion from Target Dynamics via Dual-Interval Motion Cues for UAV Detection

作者: Liuyang Wang, Feitian Zhang
arXiv: 2605.22605v1
分类: cs.RO, cs.CV
📝 论文摘要
从无人机(UAV)进行目标检测面临严重的自运动、相机抖动以及尺度剧烈变化等挑战。尽管现代检测器在静态图像上表现良好,但直接应用于无人机视频时常常失效,尤其是针对动态场景中的小目标。现有的基于运动的方法要么依赖计算成本高昂的光流,要么采用单间隔差分法,后者对抖动敏感且难以捕捉多样化的运动模式。我们提出了一种基于纯视觉的运动引导检测框架,将目标运动与相机引发的干扰解耦。首先通过基于单应性的全局运动补偿(GMC)对齐相邻帧,随后引入双间隔运动提取策略,以同时捕获短时和长时运动线索。为融合这些线索,轻量级的运动引导注意力(MGA)模块在特征金字塔网络中增强特征表示。在VisDrone-VID数据集上的实验表明,在严重自运动条件下,该方法相较于强基准模型YOLOv8取得了一致的性能提升。消融实验进一步验证了双间隔设计及所提运动引导注意力机制的有效性。

📊 核心分析

🎯 研究动机
- 无人机(UAV)目标检测面临严重**自运动(ego-motion)**、**相机抖动(camera jitter)** 和**尺度变化(scale variation)** 的挑战 - 现有静态图像检测器直接应用于无人机视频时效果不佳,尤其对**动态场景中的小目标(small objects)** 失效 - 基于运动的方法存在局限:**光流(optical flow)** 计算代价高,**单间隔差分(single-interval differencing)** 对抖动敏感且无法捕捉多样化运动模式
🔧 核心方法
- 提出**视觉-only运动引导检测框架(vision-only motion-guided detection framework)**,通过**全局运动补偿(Global Motion Compensation, GMC)** 基于单应性(homography)对齐相邻帧 - 设计**双间隔运动提取策略(Dual-Interval Motion Extraction)**,同时捕获**短期(short-term)** 和**长期(long-term)** 运动线索 - 引入**轻量运动引导注意力模块(Motion-Guided Attention, MGA)**,在**特征金字塔网络(Feature Pyramid Network)** 中增强运动相关特征表示
💡 核心创新
- **首次将自运动解耦与双间隔运动线索结合**:通过GMC消除相机干扰,并利用双间隔提取区分目标动态与噪声 - **轻量注意力机制**:MGA模块仅增加少量计算开销,即可有效聚焦运动区域,优于传统光流或单差分方法 - **针对无人机场景的鲁棒设计**:在严重自运动和抖动条件下仍能稳定提升YOLOv8基线性能,无需额外传感器信息
🏆 总体贡献
- 为**无人机视频目标检测(UAV video object detection)** 提供了一种高效的运动引导范式,显著缓解**自运动与抖动干扰** - 在**VisDrone-VID** 数据集上验证,相比强基线YOLOv8获得**一致改进(consistent improvements)** - 通过消融实验证实了**双间隔设计** 和**运动引导注意力机制** 的有效性,为后续研究提供可复现的基线