探索阿拉伯方言识别的数据和参数高效策略

于红博 · 发表于 2025-9-21 15:24:02

摘要: 本文讨论了我们对阿拉伯语方言识别（ADI）的不同数据高效和参数高效方法的探索。具体来说，我们调查了各种软提示策略，包括前缀调整、提示调整、P-调整和P-调整V2，以及LoRA重新参数化。对于数据高效策略，我们分析了使用零射和少射推断的硬提示来分析大型语言模型（LLM）的方言识别能力。对于参数高效的PEFT方法，我们在几个主要数据集上使用阿拉伯语特定的编码器模型进行了实验。我们还分析了对开源解码器模型、通用多语言模型（Phi-3.5）和阿拉伯语特定模型（SILMA）的n射推断。我们观察到，LLM通常在少射或零射设置中难以区分方言细微差别。软提示的编码器变体表现更好，而基于LoRA的微调模型表现最佳，甚至超过全面微调。

更新时间: 2025-09-18 08:09:19

领域: cs.CL,cs.AI

下载: http://arxiv.org/abs/2509.13775v2

		自动登录	找回密码
密码			立即注册