找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 35|回复: 0

忠实且快速的影响函数通过先进取样

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 18:25:23 | 显示全部楼层 |阅读模式
摘要: 我们如何解释训练数据对黑盒模型的影响? 影响函数(IFs)通过利用梯度和Hessians提供了一种事后解决方案。然而,计算整个数据集的Hessian是资源密集型的,需要一个可行的替代方案。一种常见的方法是随机抽样训练数据的一个小子集,但这种方法通常会导致IF估计极不一致,因为样本配置的方差很高。为了解决这个问题,我们提出了基于特征和logits的两种高级抽样技术。这些抽样器通过考虑特征或logits的随机分布,选择整个数据集的一个小但代表性子集,从而提高IF估计的准确性。我们通过类别移除实验验证了我们的方法,这是IFs的一个典型应用,使用F1分数来衡量模型在忘记移除的类别的同时在其余类别上保持推理一致性的效果。相比基准,我们的方法将计算时间减少了30.1%,内存使用减少了42.2%,或将F1分数提高了2.5%。
更新时间: 2025-10-30 17:55:19
领域: cs.LG,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 23:48 , Processed in 0.098844 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表