摘要
本发明属于智能对话技术领域,提供了一种用于多轮对话式问答的检索增强方法、系统及应用,通过构建含咨询问题、文档、答案及改写检索文本的四元组数据集,结合对话状态缓存与混合检索策略,利用Rewriter模型生成以检索任务为主要导向的改写文本,根据改写后的文本,动态挖掘新的难例,结合生成损失函数和多正样本对比损失函数构建联合损失函数,联合优化Rewriter模型。本发明提出多正样本对比损失函数以充分利用多轮数据集中的监督信号,提高改写模型对上下文的理解能力;提出了动态难例挖掘方法,在训练过程中根据改写结果实时做动态挖掘,以解决无法根据检索反馈实时优化改写查询的问题。