|
摘要: 大型语言模型(LLMs)在各种自然语言任务中表现出了非凡的性能。然而,一个关键挑战在于它们有时会生成事实上不正确的答案。为了解决这个问题,虽然许多先前的工作集中在识别它们生成的错误并进一步加以改进,但它们在部署时速度较慢,因为它们被设计为仅在整个生成过程(从第一个到最后一个标记)完成后才验证LLMs的响应。此外,我们观察到一旦LLMs在早期生成不正确的标记,后续标记也更有可能是事实上不正确的。因此,在这项工作中,我们提出了Streaming-VR (Streaming Verification and Refinement),这是一种旨在提高LLMs输出验证和改进效率的新方法。具体而言,提出的Streaming-VR使得能够在生成时动态验证和纠正标记,类似于流式处理,确保每个标记子集都能够在LLMs构建其响应时由另一个LLM实时检查和完善。通过对多个数据集进行全面评估,我们展示了我们的方法不仅提高了LLMs的事实准确性,而且与先前的改进方法相比提供了更有效的解决方案。 更新时间: 2025-09-19 11:59:49 领域: cs.CL,cs.AI,cs.LG
|