找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 24|回复: 0

学习全球化,说本地化:弥合多语言推理的差距

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-30 19:49:27 | 显示全部楼层 |阅读模式
摘要: 大型语言模型(LLMs)在数学、事实问答和代码生成等领域取得了强大的性能,但它们在不同语言上进行推理的能力仍未得到充分发展。特别是对于斯瓦希里语或泰语等低资源语言,LLMs经常会错误解释提示或默认以英语推理。这种对高资源语言的隐性偏见削弱了事实准确性、可解释性和信任。我们提出了一种新颖的方法M2A,它将多尺度多语言对齐与机器翻译问题的语言一致性奖励相结合,训练模型直接且准确地在目标语言中进行推理。此外,现有的多语言基准仅评估最终答案,忽视了推理是否发生在预期的语言中。为了弥补这一差距,我们引入了GeoFact-X,一个基于地理的多语言事实推理基准,以及五种语言的推理过程:英语、印地语、日语、斯瓦希里语和泰语。我们的结果显示,M2A显著提高了数学和事实推理任务中的多语言推理准确性,突显了推理感知的多语言强化学习对于稳健的跨语言泛化至关重要。
更新时间: 2025-09-26 17:57:11
领域: cs.CL,cs.AI,cs.LG

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 08:42 , Processed in 0.068412 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表