当搜索成为记忆：将机器人设计试验转化为可迁移技能

📝 论文摘要

大型语言模型（LLMs）正日益被用作进化机器人设计的提议生成器，然而大多数循环仍缺乏记忆：模拟结果虽能塑造下一代种群，却未作为可复用的设计知识得以保存。我们提出Auto-Robotist——一种自我进化的LLM智能体，它将形态搜索轨迹提炼为显式的自然语言技能库。每个技能存储一个结构原型、基于证据的正向与负向规则，以及支撑这些规则的设计评估结果，从而使得设计记忆可被检验，而非隐含于种群之中。在搜索过程中，智能体检索技能以调控LLM对精英形态的编辑，同时保留遗传算法（GA）的变异路径以进行探索；评估后，通过添加、诊断与合并操作更新技能库。在涵盖运动、穿越与物体交互的七项EvoGym任务中，Auto-Robotist改进了冷启动的5×5搜索，并将所学技能迁移至10×10的设计空间，其中基于参考条件迁移的方法在所有任务上均优于GA。这些结果表明，LLM智能体能够将昂贵的物理评估转化为可复用、可审计的设计原则。我们的代码将在接收后公开。

🎯 研究动机

- 现有基于**大语言模型(LLM)** 的进化机器人设计方法中，搜索循环缺乏记忆：仿真结果只影响当前种群，无法作为可复用的设计知识保留 - 设计的**形态-技能** 迁移困难，冷启动搜索效率低，且知识隐式在种群中，不可审查 - 研究背景：大语言模型在进化机器人设计中作为提议生成器，但缺乏将搜索历史转换为显式、可迁移设计原则的机制

🔧 核心方法

- 提出**Auto-Robotist**，一个**自进化(self-evolving)** 的LLM代理，将**形态搜索(morphology-search)** 痕迹蒸馏为显式的**自然语言技能库(natural-language skill library)** - 技能库存储**结构原型(structural archetype)**、基于证据的**正负规则(positive and negative rules)** 以及支持这些规则的已评估设计 - 搜索过程：代理检索技能以调节LLM对精英体的编辑，同时保留**遗传算法(GA)** 突变路径用于探索；评估后通过**Add、Diagnose、Merge** 操作更新技能库

💡 核心创新

- **显式记忆化**：首次将进化搜索中的设计知识转化为可检查、可复用的自然语言技能库，而非隐式存在于种群中 - **自进化机制**：LLM代理能动态添加、诊断和合并技能，实现搜索知识自适应积累 - **跨空间迁移**：将小设计空间(5x5)学习到的技能有效迁移到更大空间(10x10)，参考条件转移在所有任务上优于纯GA

🏆 总体贡献

- 为**进化机器人设计(evolutionary robot design)** 提供了一种将昂贵物理评估转化为可审计设计原则的新范式 - 在**EvoGym** 环境的7个任务（涵盖运动、穿越、物体交互）上验证了改进的冷启动搜索和有效的技能迁移 - 代码开源（接受后），促进领域内可复现性和后续研究

当搜索成为记忆：将机器人设计试验转化为可迁移技能
When Search Becomes Memory: Turning Robot Design Trials into Transferable Skills

📊 核心分析

当搜索成为记忆：将机器人设计试验转化为可迁移技能 When Search Becomes Memory: Turning Robot Design Trials into Transferable Skills

📊 核心分析

当搜索成为记忆：将机器人设计试验转化为可迁移技能
When Search Becomes Memory: Turning Robot Design Trials into Transferable Skills