- 解决**密集动态人群(dense dynamic crowds)** 中自主移动机器人的导航难题
- 现有**纯反应式规划(purely reactive planning)** 方法(如**MPPI(模型预测路径积分)**)由于预测视野有限,容易陷入局部最小值
- 研究背景:高密度动态障碍物场景对机器人安全性和可靠性的持续挑战
- 提出**RAY-TOLD** 混合控制架构,集成障碍物信息到**潜在动力学(latent dynamics)** 中
- 构建**LiDAR中心潜在动力学模型(LiDAR-centric latent dynamics model)**,将高维传感器数据编码为紧凑状态表示
- 学习**终端值函数(terminal value function)** 和**策略先验(policy prior)**
- 引入**策略混合采样策略(policy mixture sampling strategy)**,用学习策略生成的轨迹增强**MPPI候选群体(MPPI candidate population)**
- **混合架构**:首次将**MPPI的物理鲁棒性** 与**强化学习的长期预见性** 融合在同一框架中
- **策略混合采样**:通过**学习策略先验(learned policy prior)** 引导MPPI采样,兼顾短期动力学可行性和长期目标引导
- **潜在动力学整合**:将障碍物信息直接编码进潜在动力学,提高高维传感器数据利用效率
- 为密集动态障碍物避障提供了一种**混合控制新范式(hybrid control paradigm)**
- 在**随机高密度动态障碍物环境** 中显著降低碰撞率,优于纯MPPI基线
- 验证了**短期物理滚动(short-horizon physics-based rollouts)** 与**长期学习意图(long-horizon learned intent)** 结合的有效性,提升导航可靠性和安全性