找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 24|回复: 0

FLARE: 信念逻辑辅助推理与探索

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-22 19:48:21 | 显示全部楼层 |阅读模式
摘要: 基于大型语言模型(LLMs)的现代问答(QA)和推理方法通常使用提示技术,如Chain-of-Thought(CoT),假设生成的结果将更细致地探索问题空间和范围。然而,这种方法在生成符合模型产生的中间推理链的输出时存在困难。在另一端,神经符号方法如Faithful CoT(F-CoT)建议将LLMs与外部符号求解器结合起来。虽然这种方法具有很高的忠实度,但通常需要经过代码生成训练的模型,并且在任务模糊或难以严格形式化的情况下存在困难。我们引入了Faithful Logic-Aided Reasoning and Exploration(FLARE),一种新颖的可解释方法,通过任务分解来遍历问题空间。我们使用LLM规划解决方案,使用逻辑编程代码将查询软形式化为事实和谓词,并使用定义空间上的详尽多跳搜索来模拟该代码执行。我们的方法允许我们计算推理过程相对于生成的代码的忠实度,并分析多跳搜索步骤,而无需依赖外部求解器。我们的方法在9个不同的推理基准测试中有7个取得了最先进的结果。我们还展示模型的忠实度与整体性能呈正相关,并进一步证明FLARE可以准确找出在多跳搜索期间导致正确答案的决定性因素。
更新时间: 2025-09-19 13:12:33
领域: cs.AI,cs.CL,cs.LG,cs.LO

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 13:27 , Processed in 0.066580 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表