← 返回论文列表

面向GPS拒止和退化环境下无人机导航的鲁棒视觉SLAM:多范式评估与部署研究
Robust Visual SLAM for UAV Navigation in GPS-Denied and Degraded Environments: A Multi-Paradigm Evaluation and Deployment Study

作者: Prasoon Kumar, Akshay Deepak, Sandeep Kumar
arXiv: 2605.03678v1
分类: cs.RO
📝 论文摘要
在GPS拒止且视觉退化的环境中实现可靠定位对于自主无人机操作至关重要。本文对五种V-SLAM系统——ORB-SLAM3、DPVO、DROID-SLAM、DUSt3R和MASt3R——进行了系统的比较评估,这些系统涵盖了经典范式、深度学习、循环神经网络及视觉Transformer(ViT)四种类型。实验基于四个公开基准数据集(TUM RGB-D、EuRoC MAV、UMA-VI、SubT-MRS)中的精选序列,以及一个自定义的单目室内数据集,在五种受控退化条件(正常、低光照、粉尘雾霾、运动模糊及组合退化)下进行,并以亚毫米精度的Vicon系统作为真值基准。结果表明,ORB-SLAM3在严重退化条件下表现严重失效(总体轨迹成功率TSR为62.4%;在浓密雾霾下为0%),而基于学习的方法保持鲁棒:MASt3R实现了最低的退化绝对轨迹误差ATE(0.027米),DUSt3R获得了最高的跟踪成功率(96.5%)。DPVO在效率与鲁棒性之间提供了最佳平衡(18.6帧/秒、3.1 GB GPU内存、86.1% TSR),使其成为内存受限嵌入式平台的首选方案。在NVIDIA Jetson系列平台上进行的嵌入式部署分析,为SWaP约束下的无人机场景中的SLAM选型提供了可操作的指导原则。

📊 核心分析

🎯 研究动机
- 解决**GPS拒绝(GPS-denied)** 和**视觉退化(visually degraded)** 环境下无人机自主导航的定位问题 - 现有**视觉SLAM(Visual SLAM)** 方法在严重退化条件(低光、尘雾、运动模糊等)下的鲁棒性缺乏系统性比较 - 缺少对**嵌入式平台(embedded platform)** 资源约束(SWaP:尺寸、重量、功耗)下SLAM系统部署的实用指导
🔧 核心方法
- 对五种**V-SLAM系统** 进行系统比较:**ORB-SLAM3** (经典)、**DPVO** (深度学习)、**DROID-SLAM** (循环)、**DUSt3R** 和**MASt3R** (视觉Transformer) - 在四个公共基准(**TUM RGB-D**、**EuRoC MAV**、**UMA-VI**、**SubT-MRS**)和一个自定义单目室内数据集上实验 - 设置五种受控退化条件:正常、低光、尘雾、运动模糊、组合退化,并使用亚毫米级**Vicon** 运动捕捉系统提供真值 - 在**NVIDIA Jetson** 嵌入式平台上进行部署性能分析,评估帧率、GPU内存和跟踪成功率
💡 核心创新
- **首次多范式统一对比**:涵盖经典、深度学习、循环和**视觉Transformer(ViT)** 四大范式,在同一退化条件下公平评估 - **系统退化模拟**:设计五种受控退化条件并定量分析,揭示**ORB-SLAM3** 在严重退化下完全失效(密集尘雾中TSR为0%),而学习型方法更鲁棒 - **效率-鲁棒性折衷发现**:**DPVO** 以18.6 FPS、3.1 GB GPU显存、86.1% TSR成为内存受限嵌入式平台的首选 - **嵌入式部署指南**:给出针对**SWaP(尺寸、重量、功耗)约束** 的SLAM选择实用建议
🏆 总体贡献
- 为**无人机导航(UAV navigation)** 在退化环境下的**视觉SLAM视觉SLAM** 选型提供了全面的基准和定量比较 - 揭示了不同范式在多种退化条件下的性能特征和资源需求,特别是**MASt3R** 取得最低退化ATE(0.027 m),**DUSt3R** 最高跟踪成功率(96.5%) - 提供了基于**NVIDIA Jetson** 平台的嵌入式部署分析,指导实际工程中平衡精度、鲁棒性和资源消耗 - 推动了**视觉SLAM** 在真实退化场景中的鲁棒性研究和嵌入式应用发展