该论文旨在解决机器人系统中缺乏统一原则来组织智能(intelligence)、能力(capabilities)和执行(execution)的问题。研究背景是现有方法要么将技能耦合在单体架构(monolithic architectures)中,要么将功能分解为松散协调的模块(modules)或多个智能体(agents),通常缺乏对身份(identity)和控制权(control authority)的一致模型。
论文提出了AEROS (Agent Execution Runtime Operating System) 架构,其核心方法包括:
- 将机器人建模为一个单一、持久(intelligent subject)的智能体(agent)。
- 通过可安装的包——具身能力模块(Embodied Capability Modules, ECMs)来扩展其能力,每个ECM封装了可执行技能(executable skills)、模型(models)和工具(tools)。
- 由一个策略分离(policy-separated)的运行时(runtime)来强制执行约束和安全保证(safety guarantees)。
- 在PyBullet仿真环境中使用Franka Panda 7-DOF机械臂进行了参考实现和评估,覆盖了八类实验。
论文的核心创新点是与现有工作相比的独特之处:
- **统一的单智能体操作架构**:提出了将机器人视为一个单一、持久的智能主体,而非多个松散协调的智能体或模块集合,这提供了连贯的身份和控制权模型。
- **具身能力模块(ECMs)抽象**:将能力封装为可安装、可组合的模块,实现了模块化可扩展性(modular extensibility)和可组合的能力执行(composable capability execution)。
- **策略分离的运行时**:将能力执行与策略(policy)约束(如安全保证)在运行时层面分离,确保了系统级安全(system-level safety)的一致执行,同时允许能力模块的动态热插拔(hot-swapping)。
论文对该领域的整体贡献是:
- **理论框架**:形式化了将机器人作为单一智能体并通过ECMs扩展能力的视图,为机器人系统组织提供了一个新的、原则性的抽象(abstraction)。
- **系统架构与实现**:提出了AEROS架构及其参考实现,展示了模块化、安全性和可扩展性的实际可行性。
- **实证验证**:通过广泛的仿真实验(包括与基线方法的对比、策略执行、跨任务通用性、热插拔等)证明了该架构的有效性,例如在任务成功率、安全策略拦截无效动作、跨任务通用性以及运行时模块加载方面均表现出优越性能。