量化文本嵌入模型中的位置偏差

于红博 · 发表于 2026-1-4 23:21:32

摘要: 嵌入模型对信息检索（IR）和语义相似度测量任务至关重要，然而它们对于较长文本和相关位置偏差的处理仍未被充分探索。在这项研究中，我们调查了内容位置和输入大小对文本嵌入的影响。我们的实验显示，无论嵌入模型的位置编码机制如何，它们都不成比例地优先考虑输入的开头部分。消融研究表明，在文档开头插入无关文本或删除部分文本会导致修改后的嵌入与原始嵌入之间的余弦相似度降低高达12.3%，比在文档末尾进行消融更高。回归分析进一步确认了这种偏见，随着位置远离开头，即使与内容无关，句子重要性也会下降。我们假设这种效应源于预处理策略和选择的位置编码技术。这些发现量化了检索系统的敏感性，并提出了一个新的视角来评估嵌入模型的稳健性。

更新时间: 2025-12-31 03:56:06

领域: cs.CL,cs.AI,cs.IR

下载: http://arxiv.org/abs/2412.15241v4

		自动登录	找回密码
密码			立即注册

量化文本嵌入模型中的位置偏差

浏览过的版块