摘要: 尽管视觉-语言-动作模型(VLAs)在各种操作任务中显示出有希望的机器人行为,但当部署到新任务时,它们的成功率有限。为了让这些策略能够安全地与环境互动,我们需要一个能够及时发出警报的故障检测器,以便机器人可以停下来、回溯或寻求帮助。然而,现有的故障检测器仅在一个或少数特定任务上进行训练和测试,而通用型VLAs需要检测器能够在未知任务和新环境中进行泛化和检测故障。在本文中,我们介绍了多任务故障检测问题,并提出了SAFE,一个针对通用型机器人策略(如VLAs)的故障检测器。我们分析了VLA特征空间,并发现VLAs对任务成功和失败有足够的高级知识,这种知识在不同任务中是通用的。基于这一理念,我们设计了SAFE,从VLA内部特征中学习,并预测一个单一标量,指示任务失败的可能性。SAFE在成功和失败的试验中进行训练,并在未知任务上进行评估。SAFE与不同的策略架构兼容。我们在模拟和真实环境中广泛测试了它在OpenVLA、π0和π0-FAST上的性能。我们将SAFE与各种基线进行比较,并展示SAFE实现了最先进的故障检测性能,并在准确性和检测时间之间取得了最佳平衡,使用符合预测。更多的定性结果和代码可以在项目网页上找到:https://vla-safe.github.io/ 更新时间: 2025-10-30 07:02:35 领域: cs.RO,cs.AI
|