找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 9|回复: 0

MARIC:用于图像分类的多智能体推理

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-21 15:16:25 | 显示全部楼层 |阅读模式
摘要: 图像分类传统上依赖于参数密集的模型训练,需要大规模注释的数据集和广泛的微调才能实现竞争性的性能。尽管最近的视觉语言模型(VLMs)缓解了一些这些约束,但它们仍然受限于对单次表示的依赖,往往无法捕捉到视觉内容的补充方面。在本文中,我们介绍了基于多智能体推理的图像分类(MARIC),这是一个将图像分类重新构想为一个协作推理过程的多智能体框架。MARIC首先利用一个Outliner Agent来分析图像的全局主题并生成有针对性的提示。基于这些提示,三个Aspect Agents沿着不同的视觉维度提取细粒度描述。最后,一个Reasoning Agent通过集成反思步骤综合这些互补的输出,产生一个统一的表示用于分类。通过明确地将任务分解为多个视角并鼓励反思综合,MARIC缓解了参数密集训练和单一VLM推理的缺点。针对4个多样化的图像分类基准数据集的实验表明,MARIC明显优于基线,突出了多智能体视觉推理对于鲁棒且可解释的图像分类的有效性。
更新时间: 2025-09-18 11:27:00
领域: cs.CV,cs.AI,cs.CL,cs.MA

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-11-1 15:18 , Processed in 0.066978 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表