过参数化时代低成本生物启发的益处

📝 论文摘要

虽然中枢模式发生器（CPG）和多层感知器（MLP）是机器人控制中广泛使用的范式，但关于大参数空间相对优势的系统性研究却很少。在输入和输出空间较小且性能受限的情况下，拥有更多待优化参数可能不仅无助于提升学习效果，反而会阻碍学习进程。为实证检验这一现象，我们选取具有有限本体感知能力的特定机器人形态，在两种仿生范式（CPG与MLP）下分别采用进化训练与强化训练协议进行控制器优化。通过在不同奖励函数中调整参数空间，我们发现浅层MLP与密集连接的CPG相较于深层MLP或行动者-评论家架构能获得更优性能。为解释性能与参数数量之间的关系，我们引入参数影响力度量指标，该指标表明强化学习技术所需的额外参数并未转化为性能提升，从而验证了进化策略的优越性。

🎯 研究动机

在机器人控制领域，中央模式发生器(CPG)和多层感知器(MLP)是广泛使用的范式，但关于大参数空间相对优点的系统性研究很少。本研究旨在解决的核心问题是：在输入和输出空间较小、性能存在上限的特定情境下，拥有更多待优化的参数是否反而会阻碍学习过程，而不是增强它。研究背景是当前普遍存在的过参数化(overparametrization)趋势，探讨在这种背景下，低成本生物启发方法的潜在优势。

🔧 核心方法

论文采用了一种实证比较方法，具体包括： - **控制器范式**：使用两种生物启发范式——中央模式发生器(CPG)和多层感知器(MLP)。 - **优化协议**：结合进化策略(evolutionary strategies)和强化学习(reinforcement learning)训练器协议进行控制器优化。 - **实验设计**：对具有有限本体感知能力的给定机器人形态，在多种奖励函数下，系统地改变参数空间。 - **分析指标**：引入了一个新的“参数影响(Parameter Impact)”度量，用于量化性能与参数数量之间的关系。

💡 核心创新

论文的核心创新点在于： 1. **系统性实证比较**：首次在过参数化时代背景下，对CPG和MLP这两种主流生物启发控制范式，结合进化与强化学习优化器，进行了系统的、受控的实证性能比较。 2. **发现“少即是多”的特定条件**：实验结果表明，在输入/输出空间小、性能有界的场景下，浅层MLP和密集连接的CPG的性能优于更深层的MLP或演员-评论家(Actor-Critic)架构。这挑战了“参数越多越好”的普遍假设。 3. **提出“参数影响”度量**：创新性地引入了“参数影响(Parameter Impact)”这一量化指标，用以揭示强化学习技术所需的额外参数并未转化为更好的性能，从而为选择进化策略提供了实证依据。 4. **强调低成本生物启发的价值**：在过参数化成为主流的背景下，明确论证了在某些约束条件下，参数更少、结构更简单的生物启发模型（如特定配置的CPG和浅层MLP）可能更具优势。

🏆 总体贡献

论文对该领域的总体贡献是： - **提供了关键的实证证据**：通过严谨的实验，证明了在特定机器人控制问题中，过度的参数化会损害学习效率，为“过参数化并非总是有益”的观点提供了有力支持。 - **为控制器设计提供了实用指南**：研究结果直接指导实践者，在类似约束条件下，应优先考虑浅层MLP、密集连接CPG和进化策略，而非盲目追求深度网络或复杂的强化学习架构。 - **引入了新的分析工具**：提出的“参数影响”度量为未来研究评估参数效率提供了一个可量化的分析框架。 - **重新评估了生物启发方法的价值**：在深度学习主导的时代，重新凸显了结构简单、参数成本低的生物启发方法（如CPG）在解决特定实际问题时的有效性和高效性。

过参数化时代低成本生物启发的益处
Benefits of Low-Cost Bio-Inspiration in the Age of Overparametrization

📊 核心分析

过参数化时代低成本生物启发的益处 Benefits of Low-Cost Bio-Inspiration in the Age of Overparametrization

📊 核心分析

过参数化时代低成本生物启发的益处
Benefits of Low-Cost Bio-Inspiration in the Age of Overparametrization