- **具身AI(Embodied AI)** 系统在开放世界中部署日益广泛,但确保其**可靠性** 仍是一个根本性挑战
- 现有方法将测试、验证和运行时适应视为独立方向,无法应对**不确定性、人机交互和紧急行为** 等生命周期问题
- 研究背景源于AAAI'26 Bridge Program的社区讨论,旨在系统性地解决具身AI可靠性保障的难题
- 提出三个互补的可靠性方向:**可信场景测试(trustworthy scenario-based testing)**,依赖验证规范和有意义的覆盖度量
- **组合验证(compositional verification)**,利用结构化符号表示系统和环境行为
- **运行时保证机制(runtime assurance)**,适应部署中的不确定性和分布偏移
- 倡导**集成化保证工作流(integrated assurance workflows)**,通过共享的**神经符号表示(neuro-symbolic representations)** 和**持续反馈(continuous feedback)** 连接测试、验证与运行时适应
- **整体观**:将具身AI可靠性重新定义为**生命周期保障问题(lifecycle assurance problem)**,而非孤立的技术环节
- **跨阶段整合**:首次系统性地倡导测试、验证和运行时保证的**统一集成**,通过共享表示和反馈循环打破传统壁垒
- **神经符号(neuro-symbolic)** 方法作为桥梁,融合**符号推理(symbolic reasoning)** 的结构化能力与**神经网络(neural networks)** 的适应性
- 为具身AI可靠性领域提供了**社区共识和议程(community agenda)**,明确了三大技术方向和集成路线
- 提出**集成化保证工作流** 的新范式,有望改变当前测试、验证和运行时各自为政的研究现状
- 为构建能够在复杂真实环境中安全可靠运行的**可信具身AI系统(trustworthy embodied AI systems)** 奠定了方法论基础