宣示任务，执行蜂群：无人机网络中的智能体增强大模型推理

📝 论文摘要

大型语言模型（LLMs）作为网络物理系统的高级推理引擎正受到越来越多的探索，但由于异构接口、有限的环境基础以及长期闭环执行的需求，其在实时无人机群管理中的应用仍面临挑战。本文提出了一种任务无关、基于智能体增强的LLM框架用于无人机群控制，用户可通过自然语言表达任务目标，系统则通过基于环境的实时交互自主执行任务。所提出的架构将基于LLM的智能体核心与模型上下文协议（MCP）网关及基于W3C物联网（WoT）标准的无人机群网络抽象相结合。通过将无人机、传感器和服务暴露为标准化的WoT事物，该框架实现了结构化的工具交互、连续状态观测和安全执行，而无需依赖代码生成。我们使用基于ArduPilot的仿真对四种无人机群任务和六种最先进的LLM进行了评估。结果表明，尽管当前通用型LLM具备强大的推理能力，但在缺乏明确环境基础和执行支持的情况下，即使对于简单的集群任务，它们仍难以实现可靠执行。任务特定的规划工具和运行时防护措施显著提升了鲁棒性，而仅凭令牌消耗量并不能反映执行质量或可靠性。

🎯 研究动机

- 将**大语言模型(LLM)** 作为**无人机群(UAV swarm)** 控制的高层推理引擎面临三大挑战：**异构接口(heterogeneous interfaces)**、**有限的接地(limited grounding)** 以及**长时间闭环执行(long-running closed-loop execution)** - 现有方法依赖代码生成，缺乏安全性和可靠性，难以实现实时自主控制 - 需要一种**任务无关(mission-agnostic)**、自然语言驱动的框架，使无人机群能够自主执行用户任务

🔧 核心方法

- 提出**智能体增强的LLM框架(Agent-Enhanced LLM Framework)**，由**基于LLM的智能体核心(Agent Core)**、**模型上下文协议(Model Context Protocol, MCP)网关** 和基于**W3C Web of Things(WoT)** 标准的**Web-of-Drones抽象** 组成 - 将无人机、传感器和服务暴露为**标准化的WoT事物(standardized WoT Things)**，实现**结构化工具交互(structured tool-based interaction)**、**连续状态观察(continuous state observation)** 和**安全执行(safe actuation)**，完全不依赖代码生成 - 使用**ArduPilot仿真** 在四个群任务和六个**大语言模型** 上进行评估，验证框架有效性

💡 核心创新

- **首创性**：首次将**Web of Things(WoT)标准** 与**LLM智能体** 结合，实现无人机群异构设备的**统一抽象(unified abstraction)**，解决接口异构问题 - **任务无关(mission-agnostic)** 设计：框架无需重新编程即可适应不同群任务，用户仅需自然语言描述任务目标 - **无代码生成(no code generation)**：通过**工具调用(tool calling)** 和**运行时护栏(runtime guardrails)** 确保安全执行，避免不可预测的代码输出 - **关键发现**：揭示**通用大语言模型** 在缺乏明确接地(grounding)和执行支持时，即使简单群任务也难可靠执行；**任务特定规划工具(task-specific planning tools)** 和**运行时护栏** 能显著提升鲁棒性，且**令牌消耗(token consumption)** 本身不代表执行质量

🏆 总体贡献

- 为**无人机群自然语言控制** 提供了一种新颖的**智能体框架范式(agent framework paradigm)**，显著降低部署门槛 - 系统评估了六种主流**大语言模型** 在四个典型群任务上的表现，揭示了当前LLM在真实物理系统执行中的局限性及改进方向 - 推动了**W3C Web of Things标准** 在**无人机群(UAV swarm)** 领域的标准化应用，促进异构设备互联 - 提出了增强执行可靠性的实用策略（规划工具、护栏），为实际部署提供指导

宣示任务，执行蜂群：无人机网络中的智能体增强大模型推理
Say the Mission, Execute the Swarm: Agent-Enhanced LLM Reasoning in the Web-of-Drones

📊 核心分析

宣示任务，执行蜂群：无人机网络中的智能体增强大模型推理 Say the Mission, Execute the Swarm: Agent-Enhanced LLM Reasoning in the Web-of-Drones

📊 核心分析

宣示任务，执行蜂群：无人机网络中的智能体增强大模型推理
Say the Mission, Execute the Swarm: Agent-Enhanced LLM Reasoning in the Web-of-Drones