- 解决多无人机蜂群轨迹规划中**重复组合优化** 带来的计算负担和适应性不足问题
- 现有方法如Q-learning在不确定环境下行为不够平滑稳定,缺乏对专家知识的利用
- 研究背景:无人机蜂群自主需要高效、自适应且安全的轨迹规划,但传统优化方法难以在线实时调整
- 提出**专家引导的主动推理(active inference)** 框架,将多无人机轨迹设计从重复组合优化转化为**分层概率推理** 问题
- 离线阶段:使用**遗传算法-排斥力碰撞避免(GA-RF)** 规划器生成专家演示,抽象为任务、路线、运动三层次字典,学习**概率世界模型(probabilistic world model)**
- 在线阶段:通过形成符号状态的后验信念,计算**KL散度(Kullback-Leibler divergence)** 异常指标评估候选动作,实现任务分配、路线插入、运动适应和碰撞感知重规划
- 集成**扩展卡尔曼滤波(EKF)** 和**粒子滤波(PF)** 等贝叶斯状态估计器,在运动层校正轨迹不确定性
- **首创性**:首次将**主动推理(active inference)** 框架应用于无人机蜂群自适应轨迹规划,替代传统重复优化
- **分层推理范式**:通过离线学习专家演示的概率分布,在线以KL散度异常指标评估动作,无需重新运行优化器即可实现自适应重规划
- **鲁棒性提升**:结合贝叶斯状态估计器处理噪声和非平滑观测,比改进Q-learning产生更平滑稳定的行为
- **实用性验证**:使用真实飞行无人机轨迹数据验证了世界模型在噪声条件下的符号预测纠正能力
- 为无人机蜂群自适应自主提供了一种新颖的**主动推理(active inference)** 范式,显著降低在线计算复杂度
- 在仿真实验中相比改进Q-learning表现出更平滑、稳定的轨迹规划性能
- 通过真实飞行数据验证了框架在非理想观测条件下的有效性,支持实际部署应用
- 开源离线学习与在线推理结合的框架,为后续研究提供了可复现的基线方法