|
摘要: Vision-Language-Action (VLA)模型在机器人领域取得了显著的突破,其中动作块在这些进展中扮演着主导角色。鉴于机器人运动控制的实时和连续性特性,对于融合一系列连续动作块的策略对VLA模型的整体性能具有深远影响。现有方法存在抖动、停滞,甚至在机器人执行动作时出现暂停的问题,这不仅限制了可实现的执行速度,还降低了任务完成的整体成功率。本文介绍了VLA-RAIL(实时异步推理链接器),这是一个旨在解决这些问题的新颖框架,通过异步进行模型推理和机器人运动控制,保证平滑、连续和高速的动作执行。本文的核心贡献有两个方面:一个轨迹平滑器,通过多项式拟合有效过滤掉一个动作块轨迹中的噪声和抖动,以及一个块融合器,无缝地对齐当前执行的轨迹和新到达的块,确保两个连续动作块之间的位置、速度和加速度的连续性。我们在动态仿真任务基准和几个真实世界操纵任务上验证了VLA-RAIL的有效性。实验结果表明,VLA-RAIL显著减少了运动抖动,提高了执行速度,并改善了任务成功率,这将成为大规模部署VLA模型的关键基础设施。 更新时间: 2025-12-31 06:59:42 领域: cs.RO,cs.AI,eess.SY |