学习全球化，说本地化：弥合多语言推理的差距

于红博 · 发表于 2025-9-30 19:49:27

摘要: 大型语言模型（LLMs）在数学、事实问答和代码生成等领域取得了强大的性能，但它们在不同语言上进行推理的能力仍未得到充分发展。特别是对于斯瓦希里语或泰语等低资源语言，LLMs经常会错误解释提示或默认以英语推理。这种对高资源语言的隐性偏见削弱了事实准确性、可解释性和信任。我们提出了一种新颖的方法M2A，它将多尺度多语言对齐与机器翻译问题的语言一致性奖励相结合，训练模型直接且准确地在目标语言中进行推理。此外，现有的多语言基准仅评估最终答案，忽视了推理是否发生在预期的语言中。为了弥补这一差距，我们引入了GeoFact-X，一个基于地理的多语言事实推理基准，以及五种语言的推理过程：英语、印地语、日语、斯瓦希里语和泰语。我们的结果显示，M2A显著提高了数学和事实推理任务中的多语言推理准确性，突显了推理感知的多语言强化学习对于稳健的跨语言泛化至关重要。

更新时间: 2025-09-26 17:57:11

领域: cs.CL,cs.AI,cs.LG

下载: http://arxiv.org/abs/2507.05418v2

		自动登录	找回密码
密码			立即注册

学习全球化，说本地化：弥合多语言推理的差距

浏览过的版块