|
摘要: 人形机器人在人类中心环境中的应用具有巨大的潜力,但实现头部、手部和腿部的稳健全身协调仍然是一个重大挑战。我们提出了一个系统,该系统将模块化的远程操作界面与可扩展的学习框架相结合,以解决这个问题。我们的远程操作设计将人形控制分解为直观的子模块,包括手眼协调、抓取原语、手臂末端执行器跟踪和运动。这种模块化设计使我们能够高效地收集高质量的示范。在此基础上,我们引入了Choice Policy,这是一种模仿学习方法,可以生成多个候选动作并学习对其进行评分。这种架构既能实现快速推理,又能有效地建模多模态行为。我们在两项真实任务上验证了我们的方法:洗碗机装载和擦白板的全身定位操作。实验证明,Choice Policy明显优于扩散策略和标准行为克隆。此外,我们的结果表明,手眼协调对于长期任务的成功至关重要。我们的工作展示了在无结构环境中实现协调人形操作的可扩展数据收集和学习的实际路径。 更新时间: 2025-12-31 18:59:53 领域: cs.RO,cs.AI,cs.LG
|