解决视障辅助场景中安全高效的运动规划问题。现有方法在多目标优化(舒适性与安全性平衡)、泛化能力和可解释性方面存在不足。
提出了动量约束混合启发式轨迹优化框架(MHHTOF),包含三个核心组件:
- 启发式轨迹采样簇(HTSC)与动量约束轨迹优化(MTO):抑制速度(velocity)和加速度(acceleration)的突变。
- 残差增强深度强化学习(DRL)模块:精炼候选轨迹,提升时序建模(temporal modeling)和策略泛化(policy generalization)。
- 双阶段成本建模机制(DCMM):在Frenet空间确保轨迹一致性,在笛卡尔空间(Cartesian space)通过奖励驱动(reward-driven)的自适应权重整合用户偏好,实现可解释的、以用户为中心的决策。
1. **动量约束与混合启发式优化结合**:通过MTO显式约束运动动量(momentum),抑制运动突变,与启发式采样(heuristic sampling)结合,直接优化舒适性与安全性。
2. **残差增强的DRL设计**:将DRL作为传统优化方法的“精炼器”,以残差学习(residual learning)方式提升轨迹质量,增强了时序建模能力和策略对新场景的泛化能力。
3. **双阶段可解释成本建模**:在Frenet和笛卡尔双空间分别设计成本函数,前者保证轨迹几何一致性,后者通过自适应权重动态融合用户偏好,实现了优化过程的可解释性(interpretability)和用户中心化(user-centric)。
1. 提出了一个集成了传统优化方法与深度强化学习(DRL)优势的混合框架,在视障辅助规划任务中实现了舒适性、安全性、泛化性与可解释性的多目标平衡。
2. 实验证明,该框架收敛速度比基线方法快近一倍,且获得更低、更稳定的成本。在复杂动态场景中,能生成更平滑、风险更低的运动轨迹,在鲁棒性(robustness)、安全性和效率方面均具优势。