← 返回论文列表

MineXplore:面向GNSS拒止地下环境的开源强化学习探索基准
MineXplore: An Open-Source Reinforcement Learning Exploration Benchmark for GNSS-Denied Underground Environment

作者: Abhishek S, Badrikanath Praharaj, Sreeram MV
arXiv: 2606.04569
分类: cs.RO
📝 论文摘要
地下矿井为自主机器人导航带来了极端条件:GPS信号缺失、光照条件恶劣、隧道拓扑结构环多且非凸。目前开源生态系统中尚不存在基于真实生产矿井几何结构且兼容GPU加速学习管线的仿真基准场景。我们提出MineXplore——基于Leung等人2017年智利地下铜矿数据集构建的开源MuJoCo导航基准。该环境通过六级轮廓至MJCF管线重构了104,423平方米的隧道网络,包含八边形墙壁横截面、激光雷达源锯齿状墙壁几何结构、三种地形摩擦区域、全局5度倾斜角及周期性点状照明。几何保真度经与源测量地图的交并比(IoU)验证达0.9538,表面纹理相似度在六个结构维度上评分79.4%。通过RLlib对五个独立随机种子训练的单一智能体PPO基线,其最佳滚动覆盖率可达88.89%(5个种子中有3个达到90%覆盖目标),证实MineXplore在真实地下感知与拓扑条件下能够支持稳定且可复现的策略学习。

📊 核心分析

🎯 研究动机
- 地下矿山环境极端,**全球导航卫星系统(GNSS)** 信号缺失,光照退化,隧道拓扑复杂(环多且非凸),对自主导航提出严峻挑战 - 当前开源生态缺乏基于真实矿山几何、兼容**GPU加速学习管线(GPU-accelerated learning pipelines)** 的仿真基准
🔧 核心方法
- 基于**MuJoCo** 物理引擎构建开源导航基准,命名为MineXplore - 采用**六阶段轮廓到MJCF管道(six-stage contour-to-MJCF pipeline)**,将Leung等人2017年智利地下铜矿数据集重建为104,423平方米隧道网络 - 环境集成**八角形墙横截面(octagonal wall cross-sections)**、**LiDAR源锯齿形墙几何(LiDAR-sourced jagged wall geometry)**、三种地形摩擦区、全局5度倾斜及周期性点光照 - 使用**单智能体PPO算法** 通过RLlib训练,在五个独立随机种子上评估
💡 核心创新
- **首创性**:首次提供基于真实生产矿山几何的高保真开源基准,填补GNSS拒止地下环境仿真空白 - **高几何保真度**:与源测量地图的**交并比(Intersection over Union, IoU)** 达0.9538,表面纹理相似度79.4% - **兼容GPU加速**:支持**强化学习(reinforcement learning)** 管线的高效训练,验证了稳定可复现的策略学习(最佳覆盖88.89%)
🏆 总体贡献
- 为**GNSS拒止地下环境** 的自主导航探索研究提供一个标准化、可复现的评估基准 - 通过严格的几何与纹理验证,确保仿真与真实场景的保真度,促进模拟到现实(sim-to-real)迁移 - 开源实现降低研究门槛,推动**强化学习(reinforcement learning)** 在矿山机器人领域的应用