群体讨论导向的复杂推理多智能体对话模型

于红博 · 发表于 2026-1-4 23:20:45

摘要: 本文提出了一个以小组讨论为导向的多代理对话模型，以解决单一大型语言模型在复杂推理任务中的局限性。该模型采用了一个包括生成、验证和整合的三级角色分工架构。一个意见生成代理产生多样化的推理观点，一个证据验证代理检索外部知识并量化事实支持，一个一致性仲裁代理整合逻辑一致的结论。引入了自我游戏机制以扩展多路径推理轨迹，同时检索增强模块动态补充外部知识。设计了一个结合事实一致性和逻辑连贯性的复合奖励函数，并采用改进的近端策略优化策略进行协作训练。实验结果显示，所提出的模型在HotpotQA上将多跳推理准确性提高了16.8％，在2WikiMultihopQA上提高了14.3％，在MeetingBank上提高了19.2％，同时将一致性提高了21.5％。该模型比主流多代理方法具有更高的推理效率，为复杂推理任务提供了有效和稳定的解决方案。

更新时间: 2025-12-31 04:10:57

领域: cs.AI

下载: http://arxiv.org/abs/2512.24613v1

		自动登录	找回密码
密码			立即注册

群体讨论导向的复杂推理多智能体对话模型

浏览过的版块