通过规律的自适应组合将泛化融入行为生成

Building Generalization Into Behavior Generation Via Adaptive Compositions of Regularities

作者: Aravind Battaje, Malte Bernhard, Vito Mengers 等4人

arXiv: 2605.31110v1

分类: cs.RO

📝 论文摘要

机器人泛化需要关于世界结构如何组织的先验知识，但这种结构会随情境变化。本文探讨如下命题：泛化源于将规律性——机器人-环境系统中可预测的关系——适应性组合成适合情境的行为生成结构。我们通过分析AICON（主动互联）框架中的机制来检验这一命题，该框架将规律性表示为可微分网络中相互交互的过程，其中感官反馈实现组合，梯度下降生成行为。为分离出适应性组合这一关键机制，我们研究了一个简单的模拟问题，其中所有相关规律性均可识别。我们将所得模型暴露于设计时未考虑的各种新颖条件中，发现除一种情况外——该情况下编码的规律性被证明不足——模型均能生成情境适宜的行为。消融实验表明，网络会根据规律性的信息性自动调节哪些规律性影响行为。这些结果表明，规律性的适应性组合构成了将泛化能力构建到行为生成中的强归纳偏置。

📊 核心分析

🎯 研究动机

- 机器人**泛化(generalization)** 需要关于世界结构的先验知识，但结构会随情境变化 - 现有方法难以在情境变化下自适应地生成适当行为，需要一种能够灵活组合规律的机制

🔧 核心方法

- 提出**AICON(Active InterCONnect)** 框架，将**规律(regularities)** 表示为可微网络中的交互过程 - 通过**感官反馈(sensory feedback)** 实现规律的动态组合，使用**梯度下降(gradient descent)** 生成行为 - 在简单模拟问题中隔离所有相关规律，测试模型在大量新条件下的表现

💡 核心创新

- 首次将**自适应组合规律(adaptive composition of regularities)** 作为泛化的核心机制，而非依赖固定的先验结构 - 网络自动根据**信息量(informativeness)** 调节不同规律对行为的影响，无需显式设计规则 - 在几乎所有新条件下生成情境适当行为，仅当编码规律不足时失败，验证了机制的鲁棒性

🏆 总体贡献

- 证明了自适应组合规律是一种强大的**归纳偏置(inductive bias)**，可内建于行为生成中实现泛化 - 通过消融实验揭示网络自动调节规律权重的机制，为可解释性提供依据 - 为机器人领域提供了一种新的泛化范式，基于规律组合而非大量训练数据