找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 9|回复: 0

通过卷积解码和拒绝微调实现快速流畅的扩散语言模型

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-21 14:44:49 | 显示全部楼层 |阅读模式
摘要: 自回归(AR)语言模型一次生成一个令牌的文本,从而限制了其推理速度。基于扩散的语言模型提供了一种有前途的替代方案,因为它们可以并行解码多个令牌。然而,我们发现当前扩散LM中存在一个关键瓶颈:长解码窗口问题,远离输入上下文生成的令牌往往变得不相关或重复。先前的解决方案如半自回归通过将窗口分割成块来解决这个问题,但这牺牲了速度和双向性,消除了扩散模型的主要优势。为了克服这一问题,我们提出了一种基于卷积解码(Conv)的基于规范化的方法,它在没有硬分割的情况下缩小了解码窗口,从而提高了流畅性和灵活性。此外,我们引入了基于拒绝规则的微调(R2FT)后续训练方案,更好地对齐了远离上下文位置的令牌。我们的方法在开放式生成基准测试(如AlpacaEval)中取得了最先进的结果,在扩散LM基线中比先前的工作具有显著更低的步长,展示了速度和质量的改进。
更新时间: 2025-09-18 17:48:21
领域: cs.CL,cs.AI,cs.LG,68T50,I.2.7

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 08:42 , Processed in 0.077943 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表