找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 4|回复: 0

BandiK:使用多臂赌博框架进行高效的多任务分解

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2026-1-4 23:11:54 | 显示全部楼层 |阅读模式
摘要: 有效地跨多个任务传递知识的挑战至关重要,并且也存在于具有基础模型的下游任务中。然而,转移的性质,其传递性与非传递性的性质,仍然是一个未解决的问题,负迁移仍然是一个重要障碍。在多任务学习中选择有益的辅助任务集经常受到它们评估的高计算成本、大量可能的候选辅助集和选择在目标任务中的不同复杂性的阻碍。 为了解决这些限制,我们引入了BandiK,一种新颖的三阶段多任务辅助任务子集选择方法,使用多臂赌博机,在每个臂拉动时通过在一个随机的训练-测试数据集分割上训练和测试多输出神经网络来评估候选辅助集。首先,BandiK估计任务之间的成对转移,有助于确定哪些任务可能从联合学习中受益。在第二阶段,它基于初始估计为每个目标任务构建了一系列候选辅助任务集(在所有任务数量上),从而显著减少了潜在辅助任务集的指数数量。第三,它为每个任务采用多臂赌博机(MAB)框架,其中臂对应于在训练-测试数据集分割上实现为多输出神经网络的候选辅助集的性能。为了提高效率,BandiK将这些单独的任务特定MAB集成到一个多臂赌博机结构中。提出的多臂赌博机解决方案利用了相同的神经网络实现了给定候选集对应的多个不同单独赌博机的臂。这种半重叠臂属性定义了BandiK中使用的新颖多臂赌博机成本/奖励结构。
更新时间: 2025-12-31 08:25:15
领域: cs.LG,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 17:00 , Processed in 0.072767 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表