当搜索成为记忆:将机器人设计试验转化为可迁移技能
When Search Becomes Memory: Turning Robot Design Trials into Transferable Skills
作者:
Yunfei Wang, Xiaohao Xu, Yang Li 等4人
分类:
cs.RO, cs.AI, cs.CL, cs.CV
📝 论文摘要
大型语言模型(LLMs)正日益被用作进化机器人设计的提议生成器,然而大多数循环仍缺乏记忆:模拟结果虽能塑造下一代种群,却未作为可复用的设计知识得以保存。我们提出Auto-Robotist——一种自我进化的LLM智能体,它将形态搜索轨迹提炼为显式的自然语言技能库。每个技能存储一个结构原型、基于证据的正向与负向规则,以及支撑这些规则的设计评估结果,从而使得设计记忆可被检验,而非隐含于种群之中。在搜索过程中,智能体检索技能以调控LLM对精英形态的编辑,同时保留遗传算法(GA)的变异路径以进行探索;评估后,通过添加、诊断与合并操作更新技能库。在涵盖运动、穿越与物体交互的七项EvoGym任务中,Auto-Robotist改进了冷启动的5×5搜索,并将所学技能迁移至10×10的设计空间,其中基于参考条件迁移的方法在所有任务上均优于GA。这些结果表明,LLM智能体能够将昂贵的物理评估转化为可复用、可审计的设计原则。我们的代码将在接收后公开。
📊 核心分析
- 现有基于**大语言模型(LLM)** 的进化机器人设计方法中,搜索循环缺乏记忆:仿真结果只影响当前种群,无法作为可复用的设计知识保留
- 设计的**形态-技能** 迁移困难,冷启动搜索效率低,且知识隐式在种群中,不可审查
- 研究背景:大语言模型在进化机器人设计中作为提议生成器,但缺乏将搜索历史转换为显式、可迁移设计原则的机制
- 提出**Auto-Robotist**,一个**自进化(self-evolving)** 的LLM代理,将**形态搜索(morphology-search)** 痕迹蒸馏为显式的**自然语言技能库(natural-language skill library)**
- 技能库存储**结构原型(structural archetype)**、基于证据的**正负规则(positive and negative rules)** 以及支持这些规则的已评估设计
- 搜索过程:代理检索技能以调节LLM对精英体的编辑,同时保留**遗传算法(GA)** 突变路径用于探索;评估后通过**Add、Diagnose、Merge** 操作更新技能库
- **显式记忆化**:首次将进化搜索中的设计知识转化为可检查、可复用的自然语言技能库,而非隐式存在于种群中
- **自进化机制**:LLM代理能动态添加、诊断和合并技能,实现搜索知识自适应积累
- **跨空间迁移**:将小设计空间(5x5)学习到的技能有效迁移到更大空间(10x10),参考条件转移在所有任务上优于纯GA
- 为**进化机器人设计(evolutionary robot design)** 提供了一种将昂贵物理评估转化为可审计设计原则的新范式
- 在**EvoGym** 环境的7个任务(涵盖运动、穿越、物体交互)上验证了改进的冷启动搜索和有效的技能迁移
- 代码开源(接受后),促进领域内可复现性和后续研究