- 家庭机器人难以在开放环境中自主操作**铰接物体(articulated objects)**,现有方法缺乏多样性轨迹基元
- 实际部署中需要面对实时约束和意外变化,单一轨迹无法应对,因此需要**多种解决方案(solutions)**供机器人选择最优策略
- 研究背景:尽管学习与机器人技术取得进展,但自主操作仍受限于轨迹生成的单一性和泛化能力不足
- 提出**QDTraj**框架,基于**质量-多样性(Quality-Diversity, QD)**算法自动生成机器人低级轨迹基元
- 采用**稀疏奖励探索(sparse reward exploration)**策略,在给定操作任务中产生一组**多样化且高性能(diverse and high-performing)**的轨迹
- 针对每个铰接物体(如合页、滑块)自动生成不同低级运动指令,覆盖多种实现同一目标的路径
- **首次将QD算法引入铰接物体操作**:利用质量-多样性优化同时追求轨迹性能与行为多样性,区别于传统只关注单一最优解的方法
- **强调轨迹多样性对实际部署的重要性**:机器人可根据实时约束选择最优基元,提升灵活性与鲁棒性
- **生成轨迹数量远超现有方法**:对合页和滑块任务生成的轨迹多样性至少提高5倍,且在PartNetMobility数据集上平均每任务生成704条不同轨迹
- 为**铰接物体操作(articulated objects manipulation)**提供了一种**自动生成多样化轨迹基元**的新范式
- 通过模拟训练和真实世界验证,证明了方法在多种铰接类型上的**泛化能力(generalization)**
- 开源代码(提供链接)促进可复现研究,推动家庭机器人自主操作领域的进步