通过推理飞行：自适应无人机集群的主动推理世界模型

📝 论文摘要

本文提出了一种专家引导的主动推理启发式框架，用于自适应无人机集群轨迹规划。该方法将多无人机轨迹设计从重复的组合优化问题转化为分层概率推断问题。在离线阶段，采用带斥力碰撞避免的遗传算法规划器生成专家示范，并将其抽象为任务、航线和运动词典。利用这些词典学习一个概率世界模型，该模型捕捉专家任务分配如何诱导航线顺序，以及航线顺序如何诱导运动层级行为。在在线运行阶段，无人机集群通过对符号状态形成后验信念，并基于专家导出的参考分布最小化基于KL散度的异常指标来评估候选行动。这使得无需重新运行离线优化器即可实现任务分配、航线插入、运动自适应和考虑碰撞的重新规划。在运动层面集成了包括扩展卡尔曼滤波器和粒子滤波器模块在内的贝叶斯状态估计器，以在不确定性下改进轨迹修正。仿真结果表明，所提框架保留了类似专家的规划结构，同时比改进的Q学习产生更平滑、更稳定的行为。使用真实飞行无人机轨迹数据的额外验证表明，学习到的世界模型能够修正噪声和非平滑观测下的符号预测，支持其在自适应无人机集群自主性中的适用性。

🎯 研究动机

- 解决多无人机蜂群轨迹规划中**重复组合优化** 带来的计算负担和适应性不足问题 - 现有方法如Q-learning在不确定环境下行为不够平滑稳定，缺乏对专家知识的利用 - 研究背景：无人机蜂群自主需要高效、自适应且安全的轨迹规划，但传统优化方法难以在线实时调整

🔧 核心方法

- 提出**专家引导的主动推理(active inference)** 框架，将多无人机轨迹设计从重复组合优化转化为**分层概率推理** 问题 - 离线阶段：使用**遗传算法-排斥力碰撞避免(GA-RF)** 规划器生成专家演示，抽象为任务、路线、运动三层次字典，学习**概率世界模型(probabilistic world model)** - 在线阶段：通过形成符号状态的后验信念，计算**KL散度(Kullback-Leibler divergence)** 异常指标评估候选动作，实现任务分配、路线插入、运动适应和碰撞感知重规划 - 集成**扩展卡尔曼滤波(EKF)** 和**粒子滤波(PF)** 等贝叶斯状态估计器，在运动层校正轨迹不确定性

💡 核心创新

- **首创性**：首次将**主动推理(active inference)** 框架应用于无人机蜂群自适应轨迹规划，替代传统重复优化 - **分层推理范式**：通过离线学习专家演示的概率分布，在线以KL散度异常指标评估动作，无需重新运行优化器即可实现自适应重规划 - **鲁棒性提升**：结合贝叶斯状态估计器处理噪声和非平滑观测，比改进Q-learning产生更平滑稳定的行为 - **实用性验证**：使用真实飞行无人机轨迹数据验证了世界模型在噪声条件下的符号预测纠正能力

🏆 总体贡献

- 为无人机蜂群自适应自主提供了一种新颖的**主动推理(active inference)** 范式，显著降低在线计算复杂度 - 在仿真实验中相比改进Q-learning表现出更平滑、稳定的轨迹规划性能 - 通过真实飞行数据验证了框架在非理想观测条件下的有效性，支持实际部署应用 - 开源离线学习与在线推理结合的框架，为后续研究提供了可复现的基线方法

通过推理飞行：自适应无人机集群的主动推理世界模型
Flying by Inference: Active Inference World Models for Adaptive UAV Swarms

📊 核心分析

通过推理飞行：自适应无人机集群的主动推理世界模型 Flying by Inference: Active Inference World Models for Adaptive UAV Swarms

📊 核心分析

通过推理飞行：自适应无人机集群的主动推理世界模型
Flying by Inference: Active Inference World Models for Adaptive UAV Swarms