找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 28|回复: 0

探索阿拉伯方言识别的数据和参数高效策略

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-21 15:24:02 | 显示全部楼层 |阅读模式
摘要: 本文讨论了我们对阿拉伯语方言识别(ADI)的不同数据高效和参数高效方法的探索。具体来说,我们调查了各种软提示策略,包括前缀调整、提示调整、P-调整和P-调整V2,以及LoRA重新参数化。对于数据高效策略,我们分析了使用零射和少射推断的硬提示来分析大型语言模型(LLM)的方言识别能力。对于参数高效的PEFT方法,我们在几个主要数据集上使用阿拉伯语特定的编码器模型进行了实验。我们还分析了对开源解码器模型、通用多语言模型(Phi-3.5)和阿拉伯语特定模型(SILMA)的n射推断。我们观察到,LLM通常在少射或零射设置中难以区分方言细微差别。软提示的编码器变体表现更好,而基于LoRA的微调模型表现最佳,甚至超过全面微调。
更新时间: 2025-09-18 08:09:19
领域: cs.CL,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-11-1 15:13 , Processed in 0.067967 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表