← 返回论文列表

HumanFlow——通过紧耦合运动跟踪、预测与控制的扩散驱动型微型飞行器人群导航
HumanFlow -- Diffusion-Driven MAV Navigation Among Humans via Tightly-Coupled Motion Tracking, Forecasting, and Control

作者: Simon Schaefer, Joshua Näf, Stefan Leutenegger
arXiv: 2605.25685v1
分类: cs.RO
📝 论文摘要
对人类在其三维场景上下文中的鲁棒且准确感知,对于将机器人融入日常生活环境至关重要。然而,现有方法往往无法预测与周围场景一致且合理准确的人体运动估计,尤其是在存在严重遮挡或部分可见性的情况下。这可能会限制机器人操作的安全性和效率。我们提出了HumanFlow,这是一种潜在扩散模型,它将人体运动追踪与预测统一起来,并以三维场景上下文为条件。我们证明,在包括严重遮挡在内的挑战性条件下,我们的人体运动模型能产生平滑且准确的预测,在追踪准确性上超越现有最先进方法,同时效率显著更高。此外,我们展示了如何通过将这些表示作为基于流匹配的近似MPC策略的条件,使HumanFlow的潜在空间与控制紧密耦合。我们通过使用真实人类轨迹进行MAV社交导航的模拟来验证我们的策略,结果表明即使在人类部分可观测的情况下,也能实现优越的导航性能并保持无碰撞。

📊 核心分析

🎯 研究动机
- 机器人在日常环境中需要**3D场景中的人体感知(3D human perception)**,但现有方法在严重遮挡或部分可见时难以预测合理准确的人体运动 - 现有方法往往生成与场景不一致的估计,限制了机器人操作的安全性和效率 - 研究背景:**社交导航(social navigation)** 中,无人机(MAV)需要对人进行鲁棒的运动跟踪和预测,以在人群中避碰
🔧 核心方法
- 提出**HumanFlow**,一个**潜在扩散模型(latent diffusion model)**,统一**人体运动跟踪和预测(human motion tracking and forecasting)**,并以**3D场景上下文(3D scene context)** 为条件 - 通过**流匹配(flow-matching)** 实现**近似MPC策略(approximate MPC policy)**,将扩散模型的潜在表示与控制器紧密耦合 - 在仿真环境中使用真实人体轨迹验证MAV社交导航性能
💡 核心创新
- **首次将潜在扩散模型应用于人体运动跟踪与预测的统一框架**,并以3D场景上下文为条件,在严重遮挡下仍能生成平滑准确的运动估计 - **潜在表示与控制器的紧密耦合**:利用流匹配的近似MPC策略,实现从感知到控制的端到端一体化,优于传统分离式方法 - **显著提升效率**:在匹配或超越SOTA跟踪精度的同时,计算效率更高,适合实时MAV导航
🏆 总体贡献
- 为**人机交互中的运动感知与导航** 提供了一种新的**扩散驱动范式(diffusion-driven paradigm)**,统一了跟踪、预测和控制 - 在**部分可观测(partial observability)** 和重遮挡条件下,实现了**无碰撞(collision-free)** 的社交导航,性能优于现有方法 - 开源代码和仿真环境(推测)促进了社区在**MAV社交导航** 领域的复现与进一步研究