一种用于多跳问答检索模型的数据增强及训练方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种用于多跳问答检索模型的数据增强及训练方法
申请号:CN202411728003
申请日期:2024-11-28
公开号:CN119669755B
公开日期:2025-07-01
类型:发明专利
摘要
本发明公开了一种用于多跳问答检索模型的数据增强及训练方法,包括如下步骤:步骤1、获取一个多跳问答数据集,该数据集由多跳问题及其对应的文档集合组成,文档集合包括第一跳检索文档、第二跳检索文档以及其他相关文档;步骤2、对文档集合中的第一跳文档、第二跳文档进行正例去噪,得到去噪后的文档用作模型训练的新正例,文档其他残余部分作为训练补充负例;步骤3、将得到的数据输入到多跳问答预训练语言模型进行训练。本发明提出了一种基于命题子句的正例去噪策略,通过将命题子句作为中间步骤,显著减少文档段落中与问题无关的信息干扰,从而提高模型对相关信息的捕获精度和效率。这一策略增强了模型在多跳推理任务中的准确性和鲁棒性。
技术关键词
预训练语言模型 词嵌入向量 超参数 样本 表达式 数据 文本段落 语义 策略 鲁棒性 矩阵 代表 定义 答案 基线 数值 序列 精度 关系
系统为您推荐了相关专利信息
无人机飞行轨迹 Viterbi算法 无线电 定位系统 信号采集单元
制粒环模 效率提升方法 网格模型 应力 刚度
实体匹配方法 Word2Vec模型 Sigmoid函数 行业知识图谱 分类器
人脸素描 加权特征 图像生成方法 图像生成网络 融合特征
样本 节点 数据 推荐模型训练 关系