CoRe-MoE：面向多地形人形机器人步态适应的对比重新加权专家混合

📝 论文摘要

人类主要依靠行走和奔跑穿越复杂地形，无需采用不必要的复杂运动模式。类似地，人形机器人应在保持自然稳定运动的同时，实现行走与奔跑间的平滑过渡。然而，由于梯度干扰以及地形依赖的视觉与动态变化导致的分布偏移，在单一策略中统一步态转换与多地形适应仍具挑战性。尽管专家混合(MoE)架构能够缓解多技能干扰，但朴素联合训练往往难以形成清晰的专家分化，限制了其有效性。为应对这些挑战，我们提出CoRe-MoE——一种将步态生成与地形适应解耦的两阶段强化学习框架。第一阶段学习稳定运动策略，产生具有平滑过渡的自然行走与奔跑行为；第二阶段引入地形感知MoE分支，通过对比目标训练门控网络，使其捕捉结构化地形表征并促进专家分化。最终动作通过基础步态策略与地形感知分支的加权融合获得，使策略在适应复杂地形的同时保持稳定运动模式。大量仿真结果表明，所提方法在成功率、运动稳定性及多地形适应性方面均优于基线方法。此外，在宇树G1人形机器人上的零样本部署验证了本框架的有效性，实现了跨楼梯、斜坡、台阶、障碍物及非结构化户外地形的稳健行走与奔跑，同时在外部扰动下保持精确落脚点定位与动态稳定性。

🎯 研究动机

- 解决**人形机器人多地形运动与步态自适应** 中，将**步态转换(walking-running transition)** 和**多地形适应(multi-terrain adaptation)** 统一到一个策略中的困难 - 现有方法受限于**梯度干扰(gradient interference)** 和**地形相关视觉与动态变化** 导致的**分布偏移(distribution shift)** - 尽管**混合专家(Mixture-of-Experts, MoE)** 架构可缓解多技能干扰，但**朴素联合训练(naive joint training)** 难以实现清晰的**专家专业化(expert specialization)**

🔧 核心方法

- 提出**CoRe-MoE**，一个**两阶段强化学习(two-stage reinforcement learning)** 框架 - 第一阶段：学习一个**稳定运动策略(stable locomotion policy)**，产生自然的**行走(walking)和奔跑(running)行为** 并实现平滑过渡 - 第二阶段：引入**地形感知MoE分支(terrain-aware MoE branch)**，通过**对比学习目标(contrastive objective)** 训练**门控网络(gating network)**，以捕获结构化地形表征并促进专家专业化 - 最终动作通过**加权融合(weighted fusion)** 基础步态策略和地形感知分支得到，保留稳定运动模式同时适应复杂地形

💡 核心创新

- **两阶段解耦设计**：将**步态生成(gait generation)** 和**地形适应(terrain adaptation)** 解耦，避免联合训练的梯度干扰 - **对比重加权(Contrastive Reweighting)**：利用对比目标塑造门控网络，使专家能够**结构化地形表征(structured terrain representations)** 并实现**专家专业化(expert specialization)** - **加权融合机制**：基础步态策略与地形感知分支的融合，既保持稳定步态又动态适应地形，实现**零样本迁移(zero-shot deployment)** 到真实机器人

🏆 总体贡献

- 为**人形机器人多地形运动** 提供了一种新颖的**两阶段MoE框架(CoRe-MoE)**，统一了步态转换和地形适应 - 在仿真中超越基线方法，在**成功率(success rate)**、**运动稳定性(locomotion stability)** 和**多地形适应性(multi-terrain adaptability)** 上均表现优异 - 在**Unitree G1人形机器人** 上实现了**零样本部署(zero-shot deployment)**，验证了在楼梯、斜坡、台阶、障碍物和非结构化户外地形上的鲁棒行走与奔跑，以及对外部扰动下的动态稳定性

CoRe-MoE：面向多地形人形机器人步态适应的对比重新加权专家混合
CoRe-MoE: Contrastive Reweighted Mixture of Experts for Multi-Terrain Humanoid Locomotion with Gait Adaptation

📊 核心分析

CoRe-MoE：面向多地形人形机器人步态适应的对比重新加权专家混合 CoRe-MoE: Contrastive Reweighted Mixture of Experts for Multi-Terrain Humanoid Locomotion with Gait Adaptation

📊 核心分析

CoRe-MoE：面向多地形人形机器人步态适应的对比重新加权专家混合
CoRe-MoE: Contrastive Reweighted Mixture of Experts for Multi-Terrain Humanoid Locomotion with Gait Adaptation