找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 44|回复: 0

不要让它消失:通过令牌时间步分配在扩散语言模型中保留编辑

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 21:43:49 | 显示全部楼层 |阅读模式
摘要: 扩散语言模型(DLMs)虽然能够实现细粒度的精细调整,但其实际可控性仍然脆弱。我们确定并正式表征了一种称为更新遗忘的中心失败模式,其中均匀且与上下文无关的更新会在不同时间步骤中引起标记级波动,擦除先前的语义编辑并破坏累积的精炼过程,从而降低流畅度和连贯性。由于这种失败源于均匀且与上下文无关的更新,有效的控制需要明确的标记排序。我们提出了标记时间步分配(TTA),通过每个标记时间步调度实现软化和语义标记排序:关键标记在早期被冻结,而不确定的标记接受持续的精炼。这基于时间步的排序可以作为固定策略或由任务信号驱动的自适应策略来实现,从而支持广泛的精炼策略。因为它纯粹在推理时间内运行,它适用于各种DLM,并自然延伸到不同的监督来源。在实证上,TTA改善了可控性和流畅性:在情感控制方面,它提高了超过20%的准确性,并将困惑度减少了近五分之一的步骤;在解毒方面,它降低了最大毒性(12.2比14.5)和困惑度(26.0比32.0)。这些结果共同表明,通过时间步分配软化排序是减轻更新遗忘和实现稳定和可控扩散文本生成的关键杠杆。
更新时间: 2025-10-30 07:21:05
领域: cs.CL,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 17:00 , Processed in 0.074783 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表