该论文旨在解决动态生产环境中移动机器人感知系统的关键挑战:
- 传统方法过度依赖难以获取的真实世界数据
- 现有系统对传感器噪声和环境变化的鲁棒性不足
- 缺乏时空一致性的多目标跟踪能力
论文提出了一种基于机器人操作系统(ROS 2)的激光雷达(LiDAR)感知框架,包含三个核心技术:
- 合成数据生成(synthetic data generation)用于模型训练
- 变换等变(transformation-equivariant) 3D检测网络,对几何变换具有内在不变性
- 基于中心位姿(center poses)的多目标跟踪(multi-object tracking)算法,确保时空一致性
论文的核心创新在于:
- 首次将变换等变(transformation-equivariant)深度学习与多目标跟踪(MOT)结合,构建端到端的工业感知系统
- 提出合成数据与等变网络的双重策略,显著降低对真实标注数据的依赖并提升噪声鲁棒性
- 设计基于中心位姿的跟踪关联方法,有效解决动态环境中目标遮挡和外观变化的挑战
论文的整体贡献包括:
- 开发了完整的ROS 2激光雷达感知框架,在72个动态场景中验证,交并比(IoU)达62.6%,集成跟踪后提升至83.12%
- 实现了91.12%的高阶跟踪准确度(HOTA),为工业移动机械臂提供了鲁棒且通用的感知解决方案
- 推动了合成数据与等变学习在工业机器人领域的应用,为数据稀缺场景下的感知系统开发提供了新范式