← 返回论文列表

面向视觉障碍场景的动量约束混合启发式轨迹优化框架与残差增强深度强化学习
Momentum-constrained Hybrid Heuristic Trajectory Optimization Framework with Residual-enhanced DRL for Visually Impaired Scenarios

作者: Yuting Zeng, Zhiwen Zheng, Jingya Wang 等9人
arXiv: 2604.14986v1
分类: cs.RO
📝 论文摘要
针对视障场景的安全高效辅助规划仍具挑战,现有方法在多目标优化、泛化性与可解释性方面存在局限。为此,本文提出动量约束混合启发式轨迹优化框架。为平衡舒适性与安全性等多重目标,该框架设计了启发式轨迹采样簇与动量约束轨迹优化模块,有效抑制速度与加速度的突变。此外,通过残差增强深度强化学习模块优化候选轨迹,提升了时序建模与策略泛化能力。最后引入双阶段代价建模机制:在Frenet空间通过代价函数确保轨迹一致性,在笛卡尔空间采用奖励驱动的自适应权重融合用户偏好,增强可解释性并实现以用户为中心的决策。实验表明,所提框架收敛所需迭代次数仅为基线方法的近一半,且获得更低更稳定的综合代价。在复杂动态场景中,该框架进一步展现出平稳的速度与加速度曲线及更低风险,验证了其在鲁棒性、安全性与效率方面的优势。

📊 核心分析

🎯 研究动机
解决视障辅助场景中安全高效的运动规划问题。现有方法在多目标优化(舒适性与安全性平衡)、泛化能力和可解释性方面存在不足。
🔧 核心方法
提出了动量约束混合启发式轨迹优化框架(MHHTOF),包含三个核心组件: - 启发式轨迹采样簇(HTSC)与动量约束轨迹优化(MTO):抑制速度(velocity)和加速度(acceleration)的突变。 - 残差增强深度强化学习(DRL)模块:精炼候选轨迹,提升时序建模(temporal modeling)和策略泛化(policy generalization)。 - 双阶段成本建模机制(DCMM):在Frenet空间确保轨迹一致性,在笛卡尔空间(Cartesian space)通过奖励驱动(reward-driven)的自适应权重整合用户偏好,实现可解释的、以用户为中心的决策。
💡 核心创新
1. **动量约束与混合启发式优化结合**:通过MTO显式约束运动动量(momentum),抑制运动突变,与启发式采样(heuristic sampling)结合,直接优化舒适性与安全性。 2. **残差增强的DRL设计**:将DRL作为传统优化方法的“精炼器”,以残差学习(residual learning)方式提升轨迹质量,增强了时序建模能力和策略对新场景的泛化能力。 3. **双阶段可解释成本建模**:在Frenet和笛卡尔双空间分别设计成本函数,前者保证轨迹几何一致性,后者通过自适应权重动态融合用户偏好,实现了优化过程的可解释性(interpretability)和用户中心化(user-centric)。
🏆 总体贡献
1. 提出了一个集成了传统优化方法与深度强化学习(DRL)优势的混合框架,在视障辅助规划任务中实现了舒适性、安全性、泛化性与可解释性的多目标平衡。 2. 实验证明,该框架收敛速度比基线方法快近一倍,且获得更低、更稳定的成本。在复杂动态场景中,能生成更平滑、风险更低的运动轨迹,在鲁棒性(robustness)、安全性和效率方面均具优势。