|
摘要: 现有的大型语言模型(LLM)代理框架面临两个重大挑战:高配置成本和静态能力。构建高质量代理通常需要在工具集成和即时工程方面进行广泛的手动工作,而已部署的代理在没有昂贵的微调的情况下很难适应动态环境。为了解决这些问题,我们提出了\textbf{Youtu-Agent},这是一个模块化框架,旨在自动生成和持续演化LLM代理。Youtu-Agent具有结构化配置系统,将执行环境、工具包和上下文管理解耦,实现灵活的重用和自动合成。我们引入了两种生成范式:\textbf{工作流}模式用于标准任务,\textbf{元代理}模式用于复杂的非标准要求,能够自动生成工具代码、提示和配置。此外,Youtu-Agent建立了一个混合策略优化系统:(1)一个\textbf{代理实践}模块,使代理能够通过上下文优化累积经验并提高性能,而无需参数更新;(2)一个\textbf{代理RL}模块,与分布式训练框架集成,实现对任何Youtu-Agent进行可扩展且稳定的强化学习的端到端大规模训练。实验表明,Youtu-Agent在WebWalkerQA(71.47%)和GAIA(72.8%)上使用开放权重模型实现了最先进的性能。我们的自动生成流水线实现了超过81%的工具合成成功率,而实践模块分别在AIME 2024/2025上提高了+2.7%和+5.4%的性能。此外,我们的代理RL训练在7B LLM上实现了40%的加速,并分别将编码/推理和搜索能力提高了35%和21%,在数学和普通/多跳QA基准上稳步提升性能。 更新时间: 2025-12-31 04:17:36 领域: cs.AI
|