找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 40|回复: 0

Gistify! 通过运行时执行实现代码库级的理解

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 18:20:57 | 显示全部楼层 |阅读模式
摘要: 随着编码代理在大型代码库中的部署越来越普遍,自动设计具有挑战性的、基于代码库的评估的需求至关重要。我们提出了Gistify,一个任务,其中编码LLM必须创建一个单一的、最小的、独立的文件,该文件可以复制代码库的特定功能。编码LLM可以完全访问代码库以及特定的入口点(例如,一个python命令),生成的文件必须复制在完整代码库中运行相同命令的输出,同时只包含执行所提供命令所需的基本组件。在Gistify上取得成功需要对代码库的结构有深刻的理解,准确地对其执行流程进行建模,以及能够生成可能很大的代码补丁。我们的研究结果显示,目前的最先进模型难以可靠地解决Gistify任务,特别是那些具有长执行跟踪的任务。
更新时间: 2025-10-30 17:58:26
领域: cs.CL,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 23:55 , Processed in 0.082635 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表