|
摘要: 开放词汇对象检测(OVD)模型通过从任意文本查询中检测对象,提供了卓越的灵活性。然而,在遥感(RS)等专业领域中,它们的零样本性能通常受到自然语言固有歧义的影响,限制了关键的下游应用。例如,OVD模型可能难以区分细粒度类别,如“渔船”和“游艇”,因为它们的嵌入相似且常常不可分割。这可能会妨碍特定用户目标,例如通过产生无关的检测来监测非法捕鱼。为了解决这个问题,我们提出了一种级联方法,将大型预训练OVD模型的广泛泛化与轻量级少样本分类器相结合。我们的方法首先使用零样本模型生成高召回率的对象提议。然后,这些提议通过实时训练在少量用户注释的示例上的紧凑分类器进行高精度的精细化,从而显著降低RS图像标注的高成本。我们框架的核心是FLAME,一种一步主动学习策略,选择最具信息量的样本进行训练。FLAME通过密度估计在决策边界附近动态识别不确定的边缘候选样本,然后通过聚类确保样本多样性。这种高效的采样技术实现了高准确性,无需昂贵的完全模型微调,并且能够在不到一分钟内进行即时调整,比最先进的替代方案快得多。我们的方法在RS基准测试中始终超越最先进的性能,为将基础模型调整到特定用户需求提供了实用和资源高效的框架。 更新时间: 2025-10-30 12:05:58 领域: cs.LG,cs.AI,cs.IR
|