半重叠多臂赌博机最佳臂识别用于序贯支持网络学习

于红博 · 发表于 2026-1-4 22:22:02

摘要: 许多现代人工智能和机器学习问题需要通过共享但不对称、计算密集的过程来评估合作伙伴的贡献，并同时选择最有利的候选人。这些问题的顺序方法可以统一在一个新的框架下，称为顺序支持网络学习（SSNL），其目标是利用试验为所有参与者选择最有利的候选合作伙伴集合；也就是说，学习一个代表最高绩效贡献的有向图。我们证明了一种新的纯探索模型，即半重叠多臂（多臂赌博机）（SOMMAB）模型，其中由于它们的臂之间存在结构重叠，单次评估会为多个赌博机提供不同的反馈，可以有效地从稀疏的候选名单中学习支持网络。我们为SOMMABs开发了一个广义的GapE算法，并推导了新的指数误差上界，改进了多臂赌博机最佳臂识别中已知的指数常数。这些界限与重叠程度成正比，显示出由于共享评估而产生的显著样本复杂性增益。从应用角度来看，这项工作为从多个学习问题中的稀疏候选中识别支持网络提供了理论基础和改进的性能保证，例如多任务学习（MTL）、辅助任务学习（ATL）、联合学习（FL）和多代理系统（MAS）。

更新时间: 2025-12-31 16:42:00

领域: cs.LG,cs.AI

下载: http://arxiv.org/abs/2512.24959v1

		自动登录	找回密码
密码			立即注册