摘要: 尽管多Agent系统(MAS)在复杂任务上表现出色,但其日益增长的自主性和操作复杂性常常导致关键的低效率,例如过度令牌消耗和由于错误信息而导致的失败。现有方法主要侧重于事后故障归因,缺乏积极的实时干预来增强鲁棒性和效率。为此,我们引入了SupervisorAgent,这是一个用于运行时、自适应监督的轻量级和模块化框架,它在不改变基础Agent架构的情况下运行。通过一个无LLM自适应过滤器触发,SupervisorAgent在关键时刻干预,积极纠正错误,引导低效行为,净化观察结果。在具有挑战性的GAIA基准测试中,SupervisorAgent将Smolagent框架的令牌消耗平均降低了29.45%,而不影响成功率。对五个额外基准测试(数学推理、代码生成和问题回答)及各种SoTA基础模型的广泛实验验证了我们方法的广泛适用性和鲁棒性。代码可在https://github.com/LINs-lab/SupervisorAgent 上找到。 更新时间: 2025-10-30 15:12:59 领域: cs.MA,cs.AI
|