|
摘要: 大型语言模型在功能和文件级别的代码生成方面表现出色,但是从头开始生成完整的代码库仍然是一个基本挑战。这个过程需要在提案和实施阶段进行一致和可靠的规划,而自然语言由于其模糊性和冗长性,不适合忠实地表示复杂的软件结构。为了解决这个问题,我们引入了仓库规划图(RPG),这是一个持久性表示,通过在一个图中编码能力、文件结构、数据流和功能,统一提案和实施级别的规划。RPG用明确的蓝图替代了模糊的自然语言,从而实现了长期规划和可扩展的代码库生成。基于RPG,我们开发了ZeroRepo,这是一个从头开始生成代码库的基于图的框架。它分为三个阶段:提案级别规划和实施级别细化以构建图,然后通过图引导的代码生成和测试验证。为了评估这个设置,我们构建了RepoCraft,一个包含1052个任务的六个真实项目的基准。在RepoCraft上,ZeroRepo生成的代码库平均有近36K行代码,大约是最强基准(Claude Code)的3.9倍,其他基准的64倍。它达到了81.5%的功能覆盖率和69.7%的通过率,分别比Claude Code高出27.3和35.8个百分点。进一步分析显示,RPG模型复杂的依赖关系,通过近线性扩展实现了越来越复杂的规划,并增强了LLM对代码库的理解,从而加速了代理程序的本地化。 更新时间: 2025-09-19 17:58:14 领域: cs.CL,cs.AI,cs.SE
|