|
摘要: 基于视觉的端到端(E2E)驾驶引起了研究界的极大兴趣,因为它具有可扩展性,并且与多模态大型语言模型(MLLMs)具有协同作用。然而,当前的E2E驾驶基准主要涵盖了名义场景,未能充分测试这些系统的真正潜力。此外,现有的开环评估指标通常无法捕捉驾驶的多模态性,或在长尾场景中有效评估性能。为了弥补这些差距,我们引入了Waymo开放数据集用于端到端驾驶(WOD-E2E)。WOD-E2E包含4,021个驾驶片段(约12小时),专门针对挑战性的长尾场景进行策划,这些场景在日常生活中很少见,发生频率低于0.03%。具体而言,WOD-E2E中的每个片段都包括高级路由信息、自我状态和来自8个周围摄像头的360度摄像头视图。为了评估在这些长尾情况下的E2E驾驶性能,我们提出了一种新颖的开环评估指标:评分者反馈分数(RFS)。与传统指标不同,传统指标衡量了预测航点与日志之间的距离,RFS衡量了预测轨迹与评分者注释的轨迹偏好标签的匹配程度。我们已经发布了所有WOD-E2E验证集片段的评分者偏好标签,而留出的测试集标签已经用于2025年的WOD-E2E挑战。通过我们的工作,我们旨在促进面向最新研究的、具有通用性、稳健性和安全性的端到端自主驾驶代理能够处理复杂的真实世界情况。 更新时间: 2025-10-30 04:25:33 领域: cs.CV,cs.AI
|