找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 2|回复: 0

半重叠多臂赌博机最佳臂识别用于序贯支持网络学习

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2026-1-4 22:22:02 | 显示全部楼层 |阅读模式
摘要: 许多现代人工智能和机器学习问题需要通过共享但不对称、计算密集的过程来评估合作伙伴的贡献,并同时选择最有利的候选人。这些问题的顺序方法可以统一在一个新的框架下,称为顺序支持网络学习(SSNL),其目标是利用试验为所有参与者选择最有利的候选合作伙伴集合;也就是说,学习一个代表最高绩效贡献的有向图。我们证明了一种新的纯探索模型,即半重叠多臂(多臂赌博机)(SOMMAB)模型,其中由于它们的臂之间存在结构重叠,单次评估会为多个赌博机提供不同的反馈,可以有效地从稀疏的候选名单中学习支持网络。 我们为SOMMABs开发了一个广义的GapE算法,并推导了新的指数误差上界,改进了多臂赌博机最佳臂识别中已知的指数常数。这些界限与重叠程度成正比,显示出由于共享评估而产生的显著样本复杂性增益。 从应用角度来看,这项工作为从多个学习问题中的稀疏候选中识别支持网络提供了理论基础和改进的性能保证,例如多任务学习(MTL)、辅助任务学习(ATL)、联合学习(FL)和多代理系统(MAS)。
更新时间: 2025-12-31 16:42:00
领域: cs.LG,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 15:43 , Processed in 0.079794 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表