该论文旨在解决双足足球机器人在动态对抗环境中面临的挑战:
- 运动稳定性与多任务深度耦合问题
- 不同状态(如直立行走与摔倒恢复)间的控制切换问题
论文提出了一种模块化强化学习(RL)框架,具体包含:
- 结合开环前馈振荡器与基于强化学习的反馈残差策略,将基础步态生成与复杂足球动作分离
- 引入姿态驱动的状态机,清晰切换寻球踢球网络(BSKN)与摔倒恢复网络(FRN)
- 采用渐进式力衰减课程学习策略高效训练FRN
- 在Unity仿真环境中对双足机器人进行验证
论文的核心创新点在于:
- 提出了开环振荡器与强化学习反馈残差相结合的新型架构,实现了基础运动与高级任务的解耦
- 设计了姿态驱动的状态机机制,从根本上解决了多任务控制中的状态干扰问题
- 开发了渐进式力衰减课程学习策略,显著提升了摔倒恢复网络的训练效率与性能
论文对该领域的整体贡献包括:
- 为双足足球机器人提供了一种自适应多任务控制解决方案
- 在受限角落场景中展示了卓越的空间适应性和可靠的寻球踢球能力
- 实现了快速自主摔倒恢复(平均恢复时间0.715秒)
- 确保了复杂多任务环境下的无缝稳定运行