PerchRL：基于视觉的快速不规则运动下倾斜平台敏捷栖息

📝 论文摘要

基于视觉的四旋翼无人机在移动倾斜平台上的自主降落对于空地协同至关重要，但受限于有限视场（FOV）而具有挑战性。本文提出PerchRL，一种基于强化学习（RL）的框架，用于在快速且不规则运动的倾斜平台上实现视觉驱动的敏捷降落。具体而言，我们采用两阶段学习策略：先进行基于状态的预训练，再进行基于视觉的微调。为提升对多样平台运动的泛化能力，我们采用随机化平台轨迹以防止过拟合，并利用时序增强方法从历史观测中捕捉潜在运动模式。在基于视觉的微调阶段，提出一种包含可见性感知状态增强与主动感知奖励的混合学习框架，以提高在间歇性视觉丢失情况下的鲁棒性。大量仿真与真实实验验证了PerchRL的可行性、稳定性及实时性能，同时在多种四旋翼平台上的成功部署进一步证明了其适应性。源代码将开源以促进社区发展。

🎯 研究动机

- 自主视觉降落在移动倾斜平台上对**空-地协作(air-ground collaboration)** 至关重要，但现有方法受限于**有限视场(limited field of view, FOV)**，难以应对快速不规则运动 - 无人机在倾斜平台上精准着陆面临视场丢失、平台运动不可预测等挑战，亟需一种鲁棒的**强化学习(reinforcement learning)** 框架 - 研究背景：随着空中机器人应用拓展，要求无人机在动态环境中实现敏捷、稳定的自主降落，而传统方法在泛化性和实时性上存在不足

🔧 核心方法

- 提出**PerchRL** 框架，采用**两阶段学习策略(two-stage learning strategy)**：先进行基于状态(state-based)的预训练，再进行基于视觉(vision-based)的微调 - 预训练阶段使用**随机化平台轨迹(randomized platform trajectories)** 防止过拟合，并通过**时间增强方法(temporal augmentation)** 从历史观测中捕获潜在运动模式 - 微调阶段引入**可见性感知状态增强(visibility-aware state augmentation)** 和**主动感知奖励(active perception rewards)**，提高在间歇性视觉丢失下的鲁棒性

💡 核心创新

- **首创性**：首次将**两阶段强化学习(two-stage RL)** 应用于倾斜平台上的视觉敏捷降落，有效桥接状态与视觉策略 - **泛化增强**：通过**随机化轨迹** 和**时间增强**，使模型适应多样化平台运动，避免过拟合于特定模式 - **鲁棒性设计**：提出**可见性感知状态增强** 和**主动感知奖励**，在视场受限时仍能保持稳定降落，区别于依赖持续视觉反馈的现有方法

🏆 总体贡献

- 为**自主四旋翼降落(autonomous quadrotor perching)** 领域提供了一种新颖的**强化学习框架(RL framework)**，解决了移动倾斜平台下的挑战 - 在仿真和真实世界实验中验证了**可行性、稳定性与实时性(real-time performance)**，并在多种四旋翼平台上成功部署，证明了**跨平台适应性(cross-platform adaptability)** - 开源源代码促进社区复现与后续研究，推动**视觉-运动控制(visual-motion control)** 在实际应用中的发展

PerchRL：基于视觉的快速不规则运动下倾斜平台敏捷栖息
PerchRL：基于视觉的快速不规则运动下倾斜平台敏捷栖息

📊 核心分析

PerchRL：基于视觉的快速不规则运动下倾斜平台敏捷栖息 PerchRL：基于视觉的快速不规则运动下倾斜平台敏捷栖息

📊 核心分析

PerchRL：基于视觉的快速不规则运动下倾斜平台敏捷栖息
PerchRL：基于视觉的快速不规则运动下倾斜平台敏捷栖息