BandiK：使用多臂赌博框架进行高效的多任务分解

于红博 · 发表于 2026-1-4 23:11:54

摘要: 有效地跨多个任务传递知识的挑战至关重要，并且也存在于具有基础模型的下游任务中。然而，转移的性质，其传递性与非传递性的性质，仍然是一个未解决的问题，负迁移仍然是一个重要障碍。在多任务学习中选择有益的辅助任务集经常受到它们评估的高计算成本、大量可能的候选辅助集和选择在目标任务中的不同复杂性的阻碍。为了解决这些限制，我们引入了BandiK，一种新颖的三阶段多任务辅助任务子集选择方法，使用多臂赌博机，在每个臂拉动时通过在一个随机的训练-测试数据集分割上训练和测试多输出神经网络来评估候选辅助集。首先，BandiK估计任务之间的成对转移，有助于确定哪些任务可能从联合学习中受益。在第二阶段，它基于初始估计为每个目标任务构建了一系列候选辅助任务集（在所有任务数量上），从而显著减少了潜在辅助任务集的指数数量。第三，它为每个任务采用多臂赌博机（MAB）框架，其中臂对应于在训练-测试数据集分割上实现为多输出神经网络的候选辅助集的性能。为了提高效率，BandiK将这些单独的任务特定MAB集成到一个多臂赌博机结构中。提出的多臂赌博机解决方案利用了相同的神经网络实现了给定候选集对应的多个不同单独赌博机的臂。这种半重叠臂属性定义了BandiK中使用的新颖多臂赌博机成本/奖励结构。

更新时间: 2025-12-31 08:25:15

领域: cs.LG,cs.AI

下载: http://arxiv.org/abs/2512.24708v1

		自动登录	找回密码
密码			立即注册