- 现有方法依赖重复的**大语言模型(LLM)**交互来处理未覆盖任务,缺乏自主学习能力
- 成功执行或观察到的外部行为无法自动转化为可复用的本地知识,造成资源浪费
- 开放环境下机器人需要持续处理**未覆盖任务(uncovered tasks)**,但传统方法依赖预定义本地方法,缺乏灵活性和可扩展性
- 提出**LLM驱动的闭环自主学习框架(LLM-driven closed-loop autonomous learning framework)**,首先检索本地方法库判断是否存在可复用方案
- 若无合适方法,触发自主学习流程:LLM作为**高层推理组件(high-level reasoning component)**进行任务分析、候选模型选择、数据收集规划和执行/观察策略组织
- 机器人从**自我执行(self-execution)**和**主动观察(active observation)**中学习,进行准实时训练与调整,将验证后的结果存入本地方法库供未来复用
- 通过闭环过程逐步将执行经验和观察经验转化为可复用的本地能力,减少对外部LLM交互的依赖
- **闭环自主学习机制**:将LLM从每次调用降级为仅当本地库无解时才使用,实现自我持续进化
- **双源学习策略**:同时利用**自我执行(self-execution)**和**主动观察(active observation)**两种经验获取方式,扩展知识来源
- **准实时训练与调整(quasi-real-time training and adjustment)**:在执行或观察后立即进行模型调整,实现快速知识内化
- **本地方法库动态更新**:将验证成功的经验自动存入库中,形成可复用的本地能力,减少未来对LLM的重复依赖
- 提出一种新颖的**LLM驱动的闭环自主学习范式**,解决了开放环境中机器人持续处理未覆盖任务时依赖外部LLM交互的痛点
- 在重复任务自我执行实验中,平均总执行时间从7.7772秒降至6.7779秒,每个任务的LLM调用次数从1.0降至0.2,显著提升效率和自主性
- 将执行和观察经验转化为可复用本地知识,为**终身学习(lifelong learning)**和**持续适应(continual adaptation)**提供了可行框架