找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 43|回复: 0

Accumulative SGD影响评估用于数据归因

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 21:47:31 | 显示全部楼层 |阅读模式
摘要: 现代数据中心的人工智能需要准确的每个样本的影响力。标准SGD-IE近似通过对每个时代的代理求和来忽略交叉时代的复合效应,这会导致对关键示例的错误排序。我们提出了ACC-SGD-IE,这是一种轨迹感知估计器,可以在整个训练过程中传播leave-one-out的扰动,并在每一步更新一个累积影响力状态。在平滑强凸设置中,它实现了几何误差收缩,在平滑非凸区域中,它收紧了误差界限;更大的小批量进一步降低了常数。在Adult、20 Newsgroups和MNIST上,无论是在清洁数据还是损坏数据下,无论是在凸还是非凸训练下,ACC-SGD-IE都可以提供更准确的影响估计,尤其是在长时间的时代中。对于下游数据清洗,它更可靠地标记嘈杂的样本,生成使用ACC-SGD-IE清洗数据训练的模型优于使用SGD-IE清洗的模型。
更新时间: 2025-10-30 06:45:22
领域: cs.LG,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 17:00 , Processed in 0.090538 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表