← 返回论文列表

DisFlow: 基于距离场的场景流用于目标姿态、速度跟踪和动态物体重建
DisFlow: Scene Flow from Distance Field for Object Pose, Velocity Tracking, and Dynamic Object Reconstruction

作者: Lan Wu, Sheila Sutjipto, Jennifer Wakulicz 等4人
arXiv: 2606.01824v1
分类: cs.RO
📝 论文摘要
我们提出了一种名为\emph{DisFlow}的新型框架,用于基于距离场的在线场景流估计,能够实现\emph{6自由度动态物体姿态估计}、\emph{运动跟踪}和\emph{表面重建}。场景通过高斯过程隐式曲面(GPIS)表示,曲面法线作为导数约束,从而在曲面附近实现精确的有符号距离计算,并带有不确定性的梯度查询。以此表示为基础,我们从距离场计算场景流,描述曲面点如何随时间在连续帧中传输。通过我们的流,我们可以通过优雅的闭式优化增量配准新观测的点云来估计物体的姿态和运动。与以往在相机或世界坐标系中运行的方法不同,我们的方法直接在\emph{物体坐标系}中进行概率融合,在该坐标系中物体随时间保持几何一致性。DisFlow方法在空间和时间上的紧密耦合产生了密集几何、曲面法线、物体姿态轨迹、速度和不确定性,且均达到实时速率。我们在动态物体序列上评估DisFlow,并证明它能够在同时重建高质量物体表面的同时实现准确的姿态和运动跟踪。代码公开于\href{https://github.com/LanWu076/disflow_ros2}{https://github.com/LanWu076/disflow\_ros2}。

📊 核心分析

🎯 研究动机
- 现有动态物体跟踪方法在**场景流(scene flow)** 估计中常受限于坐标系选择,导致物体几何随时间不一致 - 实时在线地同时估计**6DoF姿态(6DoF pose)**、速度(speed)和表面重建仍具挑战,精度与效率难以兼顾 - 研究背景:动态场景理解需要紧耦合的空间-时间融合,但传统方法多在相机或世界坐标系操作,忽略物体自身几何一致性
🔧 核心方法
- 使用**高斯过程隐式曲面(Gaussian Process Implicit Surfaces, GPIS)** 表示场景,并将表面法线作为导数约束,实现精确的**有符号距离(signed distance)** 计算与梯度查询,且附带不确定性 - 从距离场中计算**场景流(scene flow)**,描述连续帧间表面点的传输方式 - 通过增量式注册新观测点云,利用闭式优化直接在**物体坐标系(object frame)** 中估计姿态和运动 - 采用概率融合框架,在空间和时间上紧密耦合,同时输出稠密几何、法线、姿态轨迹、速度和不确定性
💡 核心创新
- **首创在物体坐标系(object frame)中进行概率融合**:与先前在相机或世界坐标系的方法不同,直接在物体坐标系中融合,保证物体几何随时间一致性 - **闭式优化(closed-form optimization)** 优雅地增量注册点云,避免复杂迭代,实现实时(real-time)运行 - **紧耦合时空(space-time coupling)** 的DisFlow方法:通过距离场场景流同时获取稠密几何、法线、位姿轨迹和速度,且输出不确定性 - **GPIS导数约束(derivative constraints)** 增强表面附近距离精度,提升场景流计算准确性
🏆 总体贡献
- 提出**DisFlow框架**,为动态物体**同步(simultaneous)** 估计6DoF姿态、运动跟踪和表面重建提供了一个统一的在线解决方案 - 在动态物体序列上验证,实现了**准确的姿态与运动跟踪(accurate pose and motion tracking)** 同时重建**高质量物体表面(high-quality object surfaces)** - 所有输出(几何、法线、轨迹、速度、不确定性)均达到**实时速率(real-time rates)**,实用性显著 - 开源代码(ROS2接口)促进领域复现与后续研究