基于视觉语言嵌入与超维计算的任务感知机器人检测扫描参数配置

📝 论文摘要

机器人激光轮廓测量被广泛用于尺寸验证和表面检测，然而测量保真度通常由传感器配置而非机器人运动主导。工业轮廓仪暴露了多个耦合参数，包括采样频率、测量范围、曝光时间、接收器动态范围和照明条件，这些参数目前仍通过试错法调整；参数失配可能导致饱和、截断或无法恢复的缺失回波信号。我们提出了基于指令条件的传感参数推荐方法：给定预扫描RGB图像和自然语言检测指令，推断机器人搭载轮廓仪关键参数的离散配置。为此，我们构建了Instruct-Obs2Param这一真实世界多模态数据集，将16个物体的检测意图、多视角姿态和光照变化与标准参数区间相关联。随后提出ScanHD超维计算框架，该框架将指令和观测绑定为任务感知编码，并通过紧凑记忆执行参数级关联推理，匹配离散扫描参数区间，同时产生稳定、可解释、低延迟的决策。在Instruct-Obs2Param数据集上，ScanHD在五个参数上实现了92.7%的平均精确匹配准确率和98.1%的平均Win@1准确率，具备强跨分割泛化能力和适合部署的低延迟推理性能，优于基于规则的启发式方法、传统多模态模型和多模态大语言模型。本工作实现了基于任务意图和场景上下文的自主指令条件传感配置，消除了人工调参，将传感器配置从静态设置提升为自适应决策变量。

🎯 研究动机

- 机器人激光轮廓测量中，传感器参数（如采样频率、曝光时间等）配置依赖人工试错，造成饱和、裁剪或数据缺失，影响测量保真度 - 现有参数配置多为静态设置，无法根据**检测任务意图(natural-language inspection instruction)** 和场景上下文自适应调整 - 多参数耦合且手动调优耗时不可靠，缺乏从视觉观察和自然语言指令直接推理离散参数配置的方法

🔧 核心方法

- 提出**ScanHD框架**，基于**超维计算(hyperdimensional computing, HDC)**，将预扫描RGB图像和自然语言指令编码为**任务感知代码(task-aware code)** - 通过**参数关联推理(parameter-wise associative reasoning)**，利用紧凑记忆结构匹配离散扫描器参数模式（如采样频率、测量范围等五参数） - 构建**Instruct-Obs2Param数据集**，包含16种物体的多视角姿态与光照变化，关联检测意图与标准参数配置，用于基准测试

💡 核心创新

- **首次** 将**超维计算(HDC)** 引入机器人检测参数配置领域，实现**指令条件感知的参数推荐**，无需传统试错或复杂多模态模型 - 相比规则启发式、常规多模态模型和**多模态大语言模型(multimodal large language models, MLLMs)**，ScanHD在准确率、泛化性和延迟上全面领先（精确准确率92.7%，Win@1准确率98.1%） - 将传感器配置从**静态设置** 提升为**自适应决策变量**，可依据任务意图和场景动态调整，消除人工干预 - 提供端到端(end-to-end)可解释推理，决策稳定且低延迟，适合实际部署

🏆 总体贡献

- 为机器人自主检测提供一种新范式：从自然语言指令和视觉观察自动推断最优传感器参数，完全消除手动调优 - 在真实多模态数据集上验证了方法的有效性，达到**SOTA(state-of-the-art)** 性能，并展现了跨分割泛化能力 - 开源了**Instruct-Obs2Param数据集** 和ScanHD框架，促进后续研究与复现 - 推动传感器配置从静态设定向任务驱动自适应决策的转变，提升工业检测的自动化与灵活性

基于视觉语言嵌入与超维计算的任务感知机器人检测扫描参数配置
Task-Aware Scanning Parameter Configuration for Robotic Inspection Using Vision Language Embeddings and Hyperdimensional Computing

📊 核心分析

基于视觉语言嵌入与超维计算的任务感知机器人检测扫描参数配置 Task-Aware Scanning Parameter Configuration for Robotic Inspection Using Vision Language Embeddings and Hyperdimensional Computing

📊 核心分析

基于视觉语言嵌入与超维计算的任务感知机器人检测扫描参数配置
Task-Aware Scanning Parameter Configuration for Robotic Inspection Using Vision Language Embeddings and Hyperdimensional Computing