该论文旨在解决人-场景交互(HSI)中长时程(LH)任务的挑战性问题。研究背景是:现有方法严重依赖通过串联预训练子任务进行技能链式调用,其环境观测与自身状态紧密耦合,缺乏泛化到新环境与技能组合的能力,无法完成跨领域的多样化LH任务。
论文提出了ALAS框架,其核心方法包括两个受生物启发的双通路解耦模块:
- 环境学习模块:用于空间理解,捕捉物体功能、空间关系和场景语义,通过完全的环境-自身解耦实现跨领域迁移。
- 技能学习模块:用于任务执行,处理包括关节自由度(DoF)和运动模式在内的自身状态信息,通过独立的运动模式编码实现跨技能迁移。
论文的核心创新点在于:
- 提出了受大脑“位置-内容”双通路机制启发的异步通路流解耦框架,首次在HSI的LH任务中实现了环境表征与技能表征的完全解耦。
- 通过环境-自身完全解耦实现跨领域环境理解迁移,通过独立运动模式编码实现跨技能迁移,突破了现有技能链方法无法泛化到新环境-技能组合的限制。
- 设计了异步通路架构,使环境学习与技能学习可并行处理不同模态信息,提高了长时程任务规划的效率和泛化能力。
论文对该领域的整体贡献包括:
- 提出了ALAS框架,为跨领域长时程任务提供了一种新的解耦学习范式。
- 在多种HSI场景的LH任务实验中,相比现有方法平均子任务成功率提升23%,平均执行效率提升29%,验证了方法的有效性。
- 为具身智能(embodied AI)和机器人任务规划领域提供了受神经科学启发的可解释架构设计思路。