- 自主视觉降落在移动倾斜平台上对**空-地协作(air-ground collaboration)** 至关重要,但现有方法受限于**有限视场(limited field of view, FOV)**,难以应对快速不规则运动
- 无人机在倾斜平台上精准着陆面临视场丢失、平台运动不可预测等挑战,亟需一种鲁棒的**强化学习(reinforcement learning)** 框架
- 研究背景:随着空中机器人应用拓展,要求无人机在动态环境中实现敏捷、稳定的自主降落,而传统方法在泛化性和实时性上存在不足
- 提出**PerchRL** 框架,采用**两阶段学习策略(two-stage learning strategy)**:先进行基于状态(state-based)的预训练,再进行基于视觉(vision-based)的微调
- 预训练阶段使用**随机化平台轨迹(randomized platform trajectories)** 防止过拟合,并通过**时间增强方法(temporal augmentation)** 从历史观测中捕获潜在运动模式
- 微调阶段引入**可见性感知状态增强(visibility-aware state augmentation)** 和**主动感知奖励(active perception rewards)**,提高在间歇性视觉丢失下的鲁棒性
- **首创性**:首次将**两阶段强化学习(two-stage RL)** 应用于倾斜平台上的视觉敏捷降落,有效桥接状态与视觉策略
- **泛化增强**:通过**随机化轨迹** 和**时间增强**,使模型适应多样化平台运动,避免过拟合于特定模式
- **鲁棒性设计**:提出**可见性感知状态增强** 和**主动感知奖励**,在视场受限时仍能保持稳定降落,区别于依赖持续视觉反馈的现有方法
- 为**自主四旋翼降落(autonomous quadrotor perching)** 领域提供了一种新颖的**强化学习框架(RL framework)**,解决了移动倾斜平台下的挑战
- 在仿真和真实世界实验中验证了**可行性、稳定性与实时性(real-time performance)**,并在多种四旋翼平台上成功部署,证明了**跨平台适应性(cross-platform adaptability)**
- 开源源代码促进社区复现与后续研究,推动**视觉-运动控制(visual-motion control)** 在实际应用中的发展