该论文旨在解决机器人编程对非专业用户(终端用户)的门槛过高问题。研究背景是:当前工业和服务机器人编程通常需要专业知识,限制了机器人在更广泛场景中的应用。
论文提出了一种结合自然交互的编程方法,具体包括:
- 使用大型语言模型(LLMs)将用户的自然语言指令转换为机器人程序。
- 利用计算机视觉(CV)识别并整合用户的支持性手势。
- 通过系统反馈(澄清问题和视觉表示)让用户审查和调整生成的程序。
论文的核心创新点在于:
- 提出了一个完整的、以人为中心的交互式编程框架,将自然语言、手势和系统反馈无缝集成。
- 与现有工作相比,其独特之处在于强调双向、自然的交互闭环(用户输入-系统反馈-用户调整),而不仅仅是单向的指令翻译,这直接针对了安全性(safety)、透明度(transparency)和用户接受度(user acceptance)等关键挑战。
论文对该领域的整体贡献是:
- 为认知机器人学(cognitive robotics)和可解释人工智能(XAI)领域提供了一个具体的、面向终端用户的机器人编程范式。
- 通过强调交互和用户控制,为解决机器人部署中的安全性和可信赖性(trustworthiness)问题提供了一种可行路径,推动了机器人从专业工具向普及化助手的发展。