找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 5|回复: 0

递归语言模型

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2026-1-4 23:21:47 | 显示全部楼层 |阅读模式
摘要: 我们研究允许大型语言模型(LLMs)通过推理时间缩放来处理任意长提示的方法。我们提出了递归语言模型(RLMs),这是一种通用的推理策略,将长提示视为外部环境的一部分,并允许LLM对提示的片段进行编程检查、分解和递归调用自身。我们发现,RLMs成功处理了两个数量级超出模型上下文窗口的输入,并且即使对于较短的提示,也在四个不同的长上下文任务中显著优于基本LLMs和常见的长上下文脚手架的质量,同时每次查询的成本相当(或更便宜)。
更新时间: 2025-12-31 03:43:41
领域: cs.AI,cs.CL

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 16:02 , Processed in 0.073115 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表