301.
检索增强生成技术被广泛用于缓解大语言模型的幻觉问题,但在多跳问答任务中仍存在准确率不足的问题,且现有的人工或模型自动标注方式缺乏有效的验证机制,容易引入低质量训练数据。为此,该文提出了一种基于自适应问题分解的检索增强生成方法。该方法采用自适应闭环训练框架,引导由大语言模型驱动的智能体对输入问题进行问题分解、检索、推理与验证。通过对预测结果的验证反馈,自适应地筛选和构建训练样本来微调模型,从而形成“生成—验证—优化”的闭环过程,以提升模型的问题分解能力,进而缓解多跳问答任务中准确率不足的问题。此外,通过结合真实答案反馈与反向验证机制,从正确和错误预测中双向构建训练样本,以降低对人工标注的依赖,并提升训练数据的质量。在三个多跳推理基准数据集上的实验表明,相比最佳基线方法,该文方法在EM和F
1指标上分别实现了最高22.7%和34.4%的提升,进一步验证了其有效性。… …
相似文献