找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 28|回复: 0

与效用相关性:RAG的过程监督改写

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-22 20:07:15 | 显示全部楼层 |阅读模式
摘要: 检索增强生成系统通常存在优化检索相关性和生成效用之间的差距:检索到的文档可能在主题上相关,但仍然缺乏生成期间有效推理所需的内容。虽然现有的“桥接”模块试图重写检索的文本以获得更好的生成效果,但我们展示它们未能捕捉到真正的文档效用。在这项工作中,我们提出了R2U,其关键区别在于直接优化以最大化通过过程监督生成正确答案的概率。由于这种直接观察是昂贵的,我们还提出通过从LLMs缩放监督来近似一个高效的蒸馏管道,这有助于较小的重写模型更好地泛化。我们在多个开放领域的问答基准测试中评估了我们的方法。实证结果显示与强桥接基线相比的持续改进。
更新时间: 2025-09-19 04:24:57
领域: cs.CL,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 06:17 , Processed in 0.073561 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表