该论文旨在解决工业环境中 料箱拣选(bin picking) 面临的挑战:
- 工业现场存在严重杂乱、遮挡问题
- 传统 3D 感知(3D sensing) 方案成本高昂
- 需要低成本、高可靠性的自动化拣选方案
论文提出了名为 Pickalo 的模块化 6D 姿态估计(6D pose estimation) 拣选流水线:
- 使用腕戴式 RGB-D 相机进行多视角主动探索
- 采用 BridgeDepth 处理原始立体流,获取适用于精确碰撞推理的精细化深度图
- 使用纯合成数据训练的 Mask-RCNN 进行实例分割,结合零样本 SAM-6D 姿态估计器进行物体定位
- 通过 姿态缓冲(pose buffer) 模块融合多视角观测,处理物体对称性并降低姿态噪声
- 离线生成大量对握抓取候选,在线基于效用排序和快速碰撞检查进行抓取规划
论文的核心创新点在于:
- 首次构建了完全基于低成本硬件的完整 6D 姿态估计 拣选系统,实现了工业级性能
- 提出了 姿态缓冲(pose buffer) 模块,通过时间融合多视角观测显著提升姿态估计的稳定性和精度
- 实现了 合成数据训练(synthetic data training) 与 零样本姿态估计(zero-shot pose estimation) 的有效结合,降低了对真实标注数据的依赖
- 在低成本硬件(UR5e机械臂、Intel RealSense D435i相机)上实现了接近高端系统的拣选效率(600次/小时)和成功率(96-99%)
论文对该领域的整体贡献包括:
- 证明了低成本硬件结合先进算法能够实现工业级料箱拣选性能,为中小企业提供了可行的自动化方案
- 提供了完整的开源系统框架,包含深度增强、姿态估计、抓取规划等模块化设计
- 通过详实的消融实验验证了增强深度估计和姿态缓冲模块在长期稳定性和吞吐量方面的关键作用
- 在真实工业场景(密集填充的欧标箱)中进行了超过30分钟的持续运行测试,展示了系统的鲁棒性