- 机器人在日常环境中需要**3D场景中的人体感知(3D human perception)**,但现有方法在严重遮挡或部分可见时难以预测合理准确的人体运动
- 现有方法往往生成与场景不一致的估计,限制了机器人操作的安全性和效率
- 研究背景:**社交导航(social navigation)** 中,无人机(MAV)需要对人进行鲁棒的运动跟踪和预测,以在人群中避碰
- 提出**HumanFlow**,一个**潜在扩散模型(latent diffusion model)**,统一**人体运动跟踪和预测(human motion tracking and forecasting)**,并以**3D场景上下文(3D scene context)** 为条件
- 通过**流匹配(flow-matching)** 实现**近似MPC策略(approximate MPC policy)**,将扩散模型的潜在表示与控制器紧密耦合
- 在仿真环境中使用真实人体轨迹验证MAV社交导航性能
- **首次将潜在扩散模型应用于人体运动跟踪与预测的统一框架**,并以3D场景上下文为条件,在严重遮挡下仍能生成平滑准确的运动估计
- **潜在表示与控制器的紧密耦合**:利用流匹配的近似MPC策略,实现从感知到控制的端到端一体化,优于传统分离式方法
- **显著提升效率**:在匹配或超越SOTA跟踪精度的同时,计算效率更高,适合实时MAV导航
- 为**人机交互中的运动感知与导航** 提供了一种新的**扩散驱动范式(diffusion-driven paradigm)**,统一了跟踪、预测和控制
- 在**部分可观测(partial observability)** 和重遮挡条件下,实现了**无碰撞(collision-free)** 的社交导航,性能优于现有方法
- 开源代码和仿真环境(推测)促进了社区在**MAV社交导航** 领域的复现与进一步研究