找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1|回复: 0

群体讨论导向的复杂推理多智能体对话模型

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2026-1-4 23:20:45 | 显示全部楼层 |阅读模式
摘要: 本文提出了一个以小组讨论为导向的多代理对话模型,以解决单一大型语言模型在复杂推理任务中的局限性。该模型采用了一个包括生成、验证和整合的三级角色分工架构。一个意见生成代理产生多样化的推理观点,一个证据验证代理检索外部知识并量化事实支持,一个一致性仲裁代理整合逻辑一致的结论。引入了自我游戏机制以扩展多路径推理轨迹,同时检索增强模块动态补充外部知识。设计了一个结合事实一致性和逻辑连贯性的复合奖励函数,并采用改进的近端策略优化策略进行协作训练。实验结果显示,所提出的模型在HotpotQA上将多跳推理准确性提高了16.8%,在2WikiMultihopQA上提高了14.3%,在MeetingBank上提高了19.2%,同时将一致性提高了21.5%。该模型比主流多代理方法具有更高的推理效率,为复杂推理任务提供了有效和稳定的解决方案。
更新时间: 2025-12-31 04:10:57
领域: cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 14:26 , Processed in 0.079080 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表