找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 54|回复: 0

使用多个弱评估器进行语言模型偏好评估

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 22:26:28 | 显示全部楼层 |阅读模式
摘要: 尽管大型语言模型(LLMs)取得了显著成功,但评估它们的输出质量仍然是一个关键挑战。现有的作品通常利用强大的LLM作为评价器,逐对比较LLMs的响应,然而这种单一评估器方法容易受到循环偏好的影响,即输出A优于B,B优于C,但C又优于A,导致评估结果矛盾。为解决这一问题,我们引入了PGED(Preference Graph Ensemble and Denoise),这是一种新颖的方法,利用多个基于模型的评估器构建偏好图,然后对这些图进行整合和去噪,以获得非循环、非矛盾的评估结果。我们为我们的框架提供了理论保证,证明其在恢复地面真实偏好结构方面的有效性。对十个基准数据集的广泛实验显示,PGED在三个应用方面表现出卓越优势:1)模型排名评估,2)测试时缩放的响应选择,以及3)模型微调的数据选择。值得注意的是,PGED结合了小型LLM评估器(如Llama3-8B,Mistral-7B,Qwen2-7B),以优于强大的评估器(如Qwen2-72B)的表现,展示了其在增强评估可靠性和提高模型性能方面的有效性。
更新时间: 2025-10-30 00:34:12
领域: cs.CL,cs.AI,cs.LG

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 16:03 , Processed in 0.077608 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表