找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 36|回复: 0

LLMs使用通用过滤头处理列表

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 18:24:43 | 显示全部楼层 |阅读模式
摘要: 我们研究了LLMs中一系列列表处理任务的机制,并发现LLMs已经学会了编码一个紧凑、因果关系表示的通用过滤操作,这反映了函数式编程中通用的“过滤器”功能。通过对多样化的列表处理任务进行因果中介分析,我们发现少数注意力头,我们称之为过滤头,编码了在特定标记处的查询状态中的过滤谓词的紧凑表示。我们展示了这个谓词表示是通用且可移植的:它可以被提取和重新应用以在不同的集合、以不同的格式、语言甚至任务中执行相同的过滤操作。然而,我们也确定了transformer LMs可以利用不同的策略进行过滤的情况:急切地评估一个项目是否满足谓词,并将这个中间结果直接存储在项目表示中。我们的结果表明,transformer LMs可以开发出人类可解释的抽象计算操作的实现,这些操作的泛化方式令人惊讶地类似于传统函数式编程模式中使用的策略。
更新时间: 2025-10-30 17:57:17
领域: cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 23:55 , Processed in 0.073480 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表