- 现有UAV移动性管理方法多为被动响应信号退化,导致切换频繁或中断率较高
- 需要在O-RAN架构下开发主动式、预测性的切换优化方案,以提升非地面用户的连接可靠性
- 研究背景:5G O-RAN中Near-RT RIC支持智能xApp,但缺乏针对沿预定轨迹飞行的UAV的高效资源管理机制
- 提出一种基于**Double Deep Q-Network (DDQN)** 强化学习的主动式UAV移动性管理xApp,部署在O-RAN Near-RT RIC中
- 融合**迁移学习(transfer learning)**,通过**集中式权重平均(centralized weight averaging)** 从多个飞行场景中聚合知识为全局模型
- 利用预测优化(predictive optimization)提前预判网络条件,做出切换决策,避免依赖实时信号退化触发
- **首创性**:首次将**DDQN** 与**迁移学习** 结合应用于O-RAN环境下的UAV切换管理
- **主动预测**:不同于被动响应,框架通过预期网络条件优化切换,同时降低中断概率和切换频率
- **跨场景泛化**:集中式权重平均使全局模型能泛化到未见过的操作环境,无需大量重训练
- **性能优势**:相比贪婪方法,减少最多**54.6%** 的切换事件,同时维持中断概率实际可忽略
- 为5G O-RAN中非地面用户提供了一种全新的**智能资源管理范式**,即基于强化学习和迁移学习的主动式xApp
- 通过详尽评估验证了智能学习方法在UAV移动性管理中能实现**切换频率与连接可靠性的良好权衡**
- 推动了空中用户设备与蜂窝网络的**无缝集成**,拓展了O-RAN架构对非地面网络的支持能力