← 返回论文列表

CAVERS:来自天然喀斯特洞穴的多模态SLAM数据集,附带真实运动捕捉数据
CAVERS: Multimodal SLAM Data from a Natural Karstic Cave with Ground Truth Motion Capture

作者: Giacomo Franchini, David Rodríguez-Martínez, Alfonso Martínez-Petersen 等5人
arXiv: 2604.15052v1
分类: cs.RO
📝 论文摘要
在天然喀斯特洞穴中运行的自主机器人面临着与矿井或隧道中截然不同的感知与导航挑战:不规则的几何结构、反光的潮湿表面、近乎零的环境光照以及复杂的分支通道。然而,针对此类环境的公开数据集仍然稀缺,且传感模式和环境多样性有限。我们提出了CAVERS数据集,该数据集采集自西班牙马拉加维多利亚洞穴中两个结构迥异的洞室,包含24个序列,总计约335 GB的记录数据。传感器套件结合了英特尔RealSense D435i RGB-D-I相机、Optris PI640i近红外热成像相机和Velodyne VLP-16激光雷达,操作方式包括手持式与轮式探测车搭载式,并在全黑暗和人工照明条件下进行采集。对于大多数序列,通过直接安装在洞穴内的Optirack运动捕捉系统提供了120赫兹频率下毫米级精度的六自由度地面真实位姿与速度数据。我们测试了涵盖视觉、视觉-惯性、热成像-惯性及激光雷达等七种前沿SLAM与里程计算法,以及三维重建流程,验证了该数据集的实用性。%数据集及所有补充材料公开于:https://github.com/spaceuma/cavers。

📊 核心分析

🎯 研究动机
该论文旨在解决在自然喀斯特洞穴环境中自主机器人面临的感知与导航挑战,这些挑战与矿井或隧道环境有本质区别:不规则几何形状、反射性潮湿表面、近乎零的环境光照以及复杂的分支通道。当前公开可用的针对此类环境的数据集稀缺,且传感模态和环境多样性有限。
🔧 核心方法
论文提出了CAVERS多模态数据集,采集自西班牙马拉加Cueva de la Victoria洞穴中两个结构不同的洞室。 - 包含24个序列,总计约335 GB数据。 - 传感器套件结合了Intel RealSense D435i RGB-D-I相机、Optris PI640i近红外热成像相机和Velodyne VLP-16激光雷达(LiDAR)。 - 数据采集方式包括手持和轮式漫游车搭载,在完全黑暗和人工照明条件下进行。 - 为大多数序列提供了由直接安装在洞穴内的Optirack运动捕捉系统采集的毫米级精度、120 Hz频率的6自由度地面真实位姿和速度。
💡 核心创新
论文的核心创新在于创建了首个在自然喀斯特洞穴环境中提供高精度地面真实运动捕捉数据的多模态数据集。 - **环境独特性**:专门针对具有不规则几何、潮湿反射表面、极低光照和复杂分支的天然洞穴环境,填补了现有数据集(如矿井、隧道)的空白。 - **多模态与高精度真值**:同步采集视觉(RGB-D)、热成像(thermal)和激光雷达(LiDAR)数据,并首次在洞穴内部署运动捕捉系统提供毫米级精度的6自由度位姿真值,这是现有洞穴数据集所缺乏的。 - **基准测试验证**:通过基准测试七种最先进的同步定位与地图构建(SLAM)和里程计算法(涵盖视觉、视觉-惯性、热-惯性和激光雷达方案)以及一个三维重建流程,实证验证了数据集的可用性和挑战性。
🏆 总体贡献
论文对该领域的整体贡献是提供了一个公开可用的、具有高精度地面真实数据的多模态洞穴环境数据集CAVERS。 - **填补数据空白**:解决了自然喀斯特洞穴环境公开数据集稀缺的问题,为算法开发与评估提供了关键资源。 - **促进算法研究**:通过涵盖多种传感模态和具有挑战性的环境条件,支持视觉、热成像、激光雷达以及多模态融合的SLAM、导航和三维重建算法的研究与性能评估。 - **设立性能基准**:提供的基准测试结果为不同SLAM和里程计算法在该类极端环境下的性能提供了初步比较和参考。