该论文旨在解决冗余机械臂路径规划中离散规划与连续执行之间的不匹配问题。研究背景是:基于体素网格(voxel-grid)的强化学习(reinforcement learning)因其简单性和可复现性被广泛用于冗余机械臂路径规划,但直接在7自由度(7-DoF)机械臂上通过逐点数值逆运动学(inverse kinematics)执行规划路径时,常导致步长抖动(step-size jitter)、关节突变(abrupt joint transitions)以及在奇异位姿(singular configurations)附近的不稳定问题。
论文提出了一个不修改离散规划器本身的桥接框架(bridging framework)。具体方法包括:
- 在规划侧:引入步长归一化的26邻域笛卡尔动作(step-normalized 26-neighbor Cartesian actions)和几何平局决胜机制(geometric tie-breaking mechanism),以抑制不必要的转向并消除步长振荡。
- 在执行侧:实现一个任务优先级阻尼最小二乘(task-priority damped least-squares, TP-DLS)逆运动学层。该层将末端执行器(end-effector)位置作为主要任务(primary task),而将姿态(posture)和关节居中(joint centering)作为次要任务(subordinate tasks)投影到零空间(null space)中处理,并结合了信任域裁剪(trust-region clipping)和关节速度约束(joint velocity constraints)。
论文的核心创新点在于:
- 提出了一个完整的桥接框架,在不改变现有离散规划器的情况下,通过改进规划动作表示和执行层控制,弥合了离散规划与连续执行之间的鸿沟。
- 在规划侧,创新的步长归一化26邻域动作和几何平局决胜机制,有效抑制了路径的冗余转向和步长振荡,提升了规划路径的平滑性。
- 在执行侧,创新的任务优先级阻尼最小二乘逆运动学层,通过分层任务处理和物理约束集成,显著提升了连续执行的稳定性与平滑度,特别是在奇异位姿附近。
- 与现有工作相比,该框架独特地同时优化了规划路径的质量(成功率、路径长度)和执行过程的物理可行性(关节加速度、稳定性),实现了端到端性能的显著提升。
论文对该领域的整体贡献是:
- 系统性地解决了基于体素强化学习的冗余机械臂规划中,离散路径在连续执行时出现的抖动、突变和不稳定问题。
- 在7自由度机械臂上的实验表明,该桥接框架在密集环境中将规划成功率从约0.58提升至1.00,将代表性路径长度从约1.53米缩短至1.10米,并在保持末端执行器误差低于1毫米的同时,将峰值关节加速度降低了一个数量级以上。
- 显著提升了基于体素的强化学习路径在冗余机械臂上的连续执行质量,为将高效的离散规划与安全的连续控制相结合提供了有效的解决方案。