找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 39|回复: 0

神经网络用于可学习和可扩展的指导微调数据影响估计

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 22:08:36 | 显示全部楼层 |阅读模式
摘要: 影响函数为模型训练提供了重要见解,但现有方法存在着巨大的计算成本和有限的泛化能力。特别是,最近的研究提出了使用语言模型计算数据影响的各种指标和算法,但这些方法在大型模型和数据集上缩放效果不佳。这是因为计算需要昂贵的前向和反向传播,需要大量内存存储大型模型,并且影响估计对新数据的泛化能力较差。在本文中,我们探讨了使用小型神经网络(我们称之为InfluenceNetwork)来估计影响值,实现了高达99%的成本降低。我们的评估表明,影响值可以用仅为完整语言模型大小的模型的0.0027%进行估计(我们使用了7B和8B版本)。我们将我们的影响值估计算法(称为NN-CIFT:用于高效指导微调的神经网络)应用于通用指导微调子集选择的下游任务。在我们的研究中,我们包括四种最先进的影响函数,并展示了NN-CIFT和原始影响函数之间在性能上没有妥协,尽管速度大大提升。我们提供了关于NN-CIFT的深入超参数分析。我们的方法的代码可以在这里找到:https://github.com/agarwalishika/NN-CIFT
更新时间: 2025-10-30 02:56:28
领域: cs.LG,cs.AI,cs.CL

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 15:43 , Processed in 0.083544 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表