找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 3|回复: 0

DarkEQA: 在低光室内环境中为具身问答基准测试视觉语言模型

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2026-1-4 22:19:50 | 显示全部楼层 |阅读模式
摘要: 视觉语言模型(VLMs)越来越被采用作为具有行为能力的代理的中央推理模块。现有的基准评估它们在理想、充分照明条件下的能力,然而鲁棒的全天候运行要求在各种视觉恶化条件下表现良好,包括夜间或黑暗环境中的低光条件——这是一项主要被忽视的核心需求。为了解决这个未被充分探索的挑战,我们提出了DarkEQA,这是一个用于评估在多级低光条件下EQ相关感知基元的开源基准。DarkEQA通过在受控恶化条件下从自我中心的观察中评估问题回答来隔离感知瓶颈,从而实现可归因的鲁棒性分析。DarkEQA的一个关键设计特点是其物理真实性:视觉恶化在线性RAW空间中建模,模拟基于物理的照明下降和传感器噪声,然后是受ISP启发的渲染管道。我们通过评估一系列最先进的VLMs和低光图像增强(LLIE)模型,展示了DarkEQA的实用性。我们的分析系统地揭示了在这些具有挑战性的视觉条件下操作时VLMs的限制。我们的代码和基准数据集将在接受后发布。
更新时间: 2025-12-31 17:31:29
领域: cs.CV,cs.AI,cs.LG,cs.RO

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 17:01 , Processed in 0.088513 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表