← 返回论文列表

关于使用条件变分自编码器改进多模态行人轨迹预测:基于基准和机器人数据的研究
On Improving Multimodal Pedestrian Trajectory Prediction with CVAE: A Study on Benchmark and Robot Data

作者: Yuzhou Liu, Cristina Olaverri-Monreal
arXiv: 2605.18262v1
分类: cs.RO
📝 论文摘要
在复杂环境(如郊区或半结构化区域中的模块化公交车与配送机器人)中运行的自主系统,精准的行人轨迹预测至关重要。社交时空图卷积神经网络通过建模社交互动展现出强大性能,然而生成多样化且校准良好的未来轨迹仍具挑战。本研究基于Social-STGCNN主干网络,引入基于条件变分自编码器的概率建模框架,显式表达多模态未来轨迹。我们在ETH和UCY行人轨迹数据集以及移动机器人采集的真实行人数据集上评估该方法。结果表明,该方法在公开基准上取得适度改进,但在不同人群配置下具有更一致的终点精度和更优的轨迹多样性。对机器人采集数据的评估进一步验证了该方法在非精心整理基准之外的有效性,支持其在实际部署中的适用性。

📊 核心分析

🎯 研究动机
- 解决**自主系统(autonomous systems)** 在复杂环境中(如模块化公交车、配送机器人)行人轨迹预测的准确性和多样性不足问题 - 现有**社交时空图卷积神经网络(Social-STGCNN)** 虽能建模社交交互,但难以生成多样化且校准良好的未来轨迹 - 研究背景:郊区或半结构化场景下的自主导航需要应对多种行人运动模式,传统单模态预测方法适应性较差
🔧 核心方法
- 以**社交时空图卷积神经网络(Social-STGCNN)** 为骨干网络,提取行人间的时空交互特征 - 引入**条件变分自编码器(Conditional Variational Autoencoder, CVAE)** 的概率公式化建模,显式表征未来轨迹的多模态分布 - 在ETH、UCY行人轨迹数据集以及移动机器人采集的真实世界数据集上进行训练和评估,验证方法的泛化能力
💡 核心创新
- **结构融合创新**:首次将**CVAE** 嵌入**Social-STGCNN** 骨干中,实现社交交互建模与多模态概率生成的结合 - **多模态显式建模**:通过CVAE的潜变量采样,克服了传统确定性预测方法只能输出单一轨迹的局限 - **实际部署验证**:不仅评估公共基准,还使用机器人自主采集的数据集,证明方法在非理想化真实场景中的有效性
🏆 总体贡献
- 在公共基准上取得**适度提升(moderate gains)**,并显著改善终点精度和不同人群配置下的轨迹多样性 - 通过机器人数据验证,展示了方法超越精心整理基准的实用性,支持在**实际部署(practical deployments)** 中的应用 - 为行人轨迹预测领域提供了一种**概率化多模态预测范式**,平衡了社交交互建模与轨迹多样性生成