- 将**大语言模型(LLM)** 作为**无人机群(UAV swarm)** 控制的高层推理引擎面临三大挑战:**异构接口(heterogeneous interfaces)**、**有限的接地(limited grounding)** 以及**长时间闭环执行(long-running closed-loop execution)**
- 现有方法依赖代码生成,缺乏安全性和可靠性,难以实现实时自主控制
- 需要一种**任务无关(mission-agnostic)**、自然语言驱动的框架,使无人机群能够自主执行用户任务
- 提出**智能体增强的LLM框架(Agent-Enhanced LLM Framework)**,由**基于LLM的智能体核心(Agent Core)**、**模型上下文协议(Model Context Protocol, MCP)网关** 和基于**W3C Web of Things(WoT)** 标准的**Web-of-Drones抽象** 组成
- 将无人机、传感器和服务暴露为**标准化的WoT事物(standardized WoT Things)**,实现**结构化工具交互(structured tool-based interaction)**、**连续状态观察(continuous state observation)** 和**安全执行(safe actuation)**,完全不依赖代码生成
- 使用**ArduPilot仿真** 在四个群任务和六个**大语言模型** 上进行评估,验证框架有效性
- **首创性**:首次将**Web of Things(WoT)标准** 与**LLM智能体** 结合,实现无人机群异构设备的**统一抽象(unified abstraction)**,解决接口异构问题
- **任务无关(mission-agnostic)** 设计:框架无需重新编程即可适应不同群任务,用户仅需自然语言描述任务目标
- **无代码生成(no code generation)**:通过**工具调用(tool calling)** 和**运行时护栏(runtime guardrails)** 确保安全执行,避免不可预测的代码输出
- **关键发现**:揭示**通用大语言模型** 在缺乏明确接地(grounding)和执行支持时,即使简单群任务也难可靠执行;**任务特定规划工具(task-specific planning tools)** 和**运行时护栏** 能显著提升鲁棒性,且**令牌消耗(token consumption)** 本身不代表执行质量
- 为**无人机群自然语言控制** 提供了一种新颖的**智能体框架范式(agent framework paradigm)**,显著降低部署门槛
- 系统评估了六种主流**大语言模型** 在四个典型群任务上的表现,揭示了当前LLM在真实物理系统执行中的局限性及改进方向
- 推动了**W3C Web of Things标准** 在**无人机群(UAV swarm)** 领域的标准化应用,促进异构设备互联
- 提出了增强执行可靠性的实用策略(规划工具、护栏),为实际部署提供指导