冗余机器人离散规划与连续执行的桥接

📝 论文摘要

体素网格强化学习因其简单性和可复现性，在冗余机械臂路径规划中被广泛采用。然而，在七自由度机械臂上直接通过逐点数值逆运动学执行规划结果，常导致步长抖动、关节突变及奇异位形附近的不稳定问题。本研究提出了一种连接离散规划与连续执行的桥接框架，无需修改离散规划器本身。在规划侧，引入步长归一化的26邻域笛卡尔动作与几何平局裁决机制，以抑制不必要的转向并消除步长振荡。在执行侧，构建了任务优先级阻尼最小二乘逆运动学层，将末端执行器位置作为主任务，姿态调整与关节居中作为投影至零空间的次级任务，并结合信赖域截断与关节速度约束。在随机稀疏、中等及密集环境中对七自由度机械臂的测试表明：该桥接框架将密集场景下的规划成功率从约0.58提升至1.00，典型路径长度从约1.53米缩短至1.10米，在保持末端执行器误差低于1毫米的同时，将关节峰值加速度降低超过一个数量级，显著提升了基于体素的强化学习路径在冗余机械臂上的连续执行质量。

🎯 研究动机

该论文旨在解决冗余机械臂路径规划中离散规划与连续执行之间的不匹配问题。研究背景是：基于体素网格(voxel-grid)的强化学习(reinforcement learning)因其简单性和可复现性被广泛用于冗余机械臂路径规划，但直接在7自由度(7-DoF)机械臂上通过逐点数值逆运动学(inverse kinematics)执行规划路径时，常导致步长抖动(step-size jitter)、关节突变(abrupt joint transitions)以及在奇异位姿(singular configurations)附近的不稳定问题。

🔧 核心方法

论文提出了一个不修改离散规划器本身的桥接框架(bridging framework)。具体方法包括： - 在规划侧：引入步长归一化的26邻域笛卡尔动作(step-normalized 26-neighbor Cartesian actions)和几何平局决胜机制(geometric tie-breaking mechanism)，以抑制不必要的转向并消除步长振荡。 - 在执行侧：实现一个任务优先级阻尼最小二乘(task-priority damped least-squares, TP-DLS)逆运动学层。该层将末端执行器(end-effector)位置作为主要任务(primary task)，而将姿态(posture)和关节居中(joint centering)作为次要任务(subordinate tasks)投影到零空间(null space)中处理，并结合了信任域裁剪(trust-region clipping)和关节速度约束(joint velocity constraints)。

💡 核心创新

论文的核心创新点在于： - 提出了一个完整的桥接框架，在不改变现有离散规划器的情况下，通过改进规划动作表示和执行层控制，弥合了离散规划与连续执行之间的鸿沟。 - 在规划侧，创新的步长归一化26邻域动作和几何平局决胜机制，有效抑制了路径的冗余转向和步长振荡，提升了规划路径的平滑性。 - 在执行侧，创新的任务优先级阻尼最小二乘逆运动学层，通过分层任务处理和物理约束集成，显著提升了连续执行的稳定性与平滑度，特别是在奇异位姿附近。 - 与现有工作相比，该框架独特地同时优化了规划路径的质量（成功率、路径长度）和执行过程的物理可行性（关节加速度、稳定性），实现了端到端性能的显著提升。

🏆 总体贡献

论文对该领域的整体贡献是： - 系统性地解决了基于体素强化学习的冗余机械臂规划中，离散路径在连续执行时出现的抖动、突变和不稳定问题。 - 在7自由度机械臂上的实验表明，该桥接框架在密集环境中将规划成功率从约0.58提升至1.00，将代表性路径长度从约1.53米缩短至1.10米，并在保持末端执行器误差低于1毫米的同时，将峰值关节加速度降低了一个数量级以上。 - 显著提升了基于体素的强化学习路径在冗余机械臂上的连续执行质量，为将高效的离散规划与安全的连续控制相结合提供了有效的解决方案。

冗余机器人离散规划与连续执行的桥接
Bridging Discrete Planning and Continuous Execution for Redundant Robot

📊 核心分析

冗余机器人离散规划与连续执行的桥接 Bridging Discrete Planning and Continuous Execution for Redundant Robot

📊 核心分析

冗余机器人离散规划与连续执行的桥接
Bridging Discrete Planning and Continuous Execution for Redundant Robot