CaMeRL: 面向多尺度障碍环境中无人机导航的碰撞感知与记忆增强强化学习

📝 论文摘要

在无人机避障导航中，障碍物尺度的变化受关注程度异常低于障碍物数量或密度。现有方法通常从单帧深度观测中提取纯几何特征，此类表征倾向于忽略小障碍物，并在大障碍物造成的遮挡下丢失空间上下文，导致在多尺度障碍物环境中性能显著退化。针对这一问题，我们提出CaMeRL——一种面向无人机导航的碰撞感知与记忆增强强化学习框架。碰撞感知潜在表征通过编码风险敏感的深度线索来保留细粒度障碍结构，从而提升对小障碍物的敏感性。时间记忆模块整合跨帧观测，减轻大障碍物遮挡造成的部分可观测性问题。我们在包含超小与超大障碍物设置的多尺度障碍物场景中评估CaMeRL。结果表明，CaMeRL在所有尺度上均优于最先进基线，在超小与超大设置中成功率分别提升0.48和0.28。更重要的是，CaMeRL能在拥挤的室外环境中实现可靠导航。

🎯 研究动机

- 现有**无人机(Unmanned Aerial Vehicle, UAV)** 避障导航方法通常仅从单帧深度观测中提取纯几何特征，忽略了障碍物尺度的变化。 - 纯几何表示容易忽视小障碍物，并在大障碍物遮挡下丢失空间上下文，导致多尺度环境下性能显著下降。 - 现有工作主要关注障碍物数量或密度，对障碍物尺度变化的关注不足。

🔧 核心方法

- 提出**CaMeRL** 框架，包含**碰撞感知潜在表示(collision-aware latent representation)** 和**时间记忆模块(temporal memory module)**。 - 碰撞感知潜在表示通过编码**风险敏感深度线索(risk-sensitive depth cues)** 保留细粒度障碍物结构，提升对小障碍物的敏感性。 - 时间记忆模块跨帧整合观测序列，缓解**大障碍物遮挡** 造成的部分可观测性问题。

💡 核心创新

- **创新性结合**：首次将**碰撞感知(collision-aware)表示** 与**时间记忆增强(memory enhancement)** 引入无人机**强化学习(Reinforcement Learning, RL)** 避障，应对多尺度障碍物环境。 - **细粒度处理**：通过风险敏感深度线索保留微小障碍物特征，区别于传统仅依赖几何特征的方案。 - **时序推理**：利用跨帧记忆机制解决大障碍物遮挡带来的观测不完整性，提升导航鲁棒性。

🏆 总体贡献

- 为无人机在多尺度障碍物环境下的导航提供了一种**新颖的强化学习框架**，同时处理小障碍物和大障碍物遮挡挑战。 - 在包含**超小障碍物(ultra-small)** 和**超大障碍物(extra-large)** 的基准测试中，CaMeRL超越现有**最优方法(state-of-the-art, SOTA)**，成功率分别提升0.48和0.28。 - 验证了方法在**杂乱室外环境(cluttered outdoor environments)** 中的可靠性，具有实际部署价值。

CaMeRL: 面向多尺度障碍环境中无人机导航的碰撞感知与记忆增强强化学习
CaMeRL: Collision-Aware and Memory-Enhanced Reinforcement Learning for UAV Navigation in Multi-Scale Obstacle Environments

📊 核心分析

CaMeRL: 面向多尺度障碍环境中无人机导航的碰撞感知与记忆增强强化学习 CaMeRL: Collision-Aware and Memory-Enhanced Reinforcement Learning for UAV Navigation in Multi-Scale Obstacle Environments

📊 核心分析

CaMeRL: 面向多尺度障碍环境中无人机导航的碰撞感知与记忆增强强化学习
CaMeRL: Collision-Aware and Memory-Enhanced Reinforcement Learning for UAV Navigation in Multi-Scale Obstacle Environments