一种基于多样本增强的非结构化文本持续关系抽取方法、装置、介质及产品
申请号:CN202410713196
申请日期:2024-06-03
公开号:CN118674035A
公开日期:2024-09-20
类型:发明专利
摘要
本发明公开一种基于多样本增强的非结构化文本持续关系抽取方法、装置、介质及产品,方法包括:通过采用对比学习损失函数,对预训练的编码器进行训练,获得一次训练后的编码器;进而计算得到语料训练集中每个语料样本的关系嵌入表示向量;然后对语料训练集中的语料样本进行聚类,并获取每一类中距离聚类中心最近的语料样本,添加至记忆库;并采用对比学习损失函数和原型相似度损失函数,对一次训练后的编码器进行训练,获得二次训练后的编码器;利用二次训练后的编码器对当前任务中的非结构化文本持续关系进行抽取。本发明通过对比学习的记忆回放策略,缓解了非结构化文本持续关系抽取中的灾难性遗忘的问题,可以持续高效地完成关系抽取任务。
技术关键词
关系抽取方法
样本
记忆
原型
编码器
文本
训练集
度量
聚类
实体
超参数
处理器
计算机装置
标签
计算机程序产品
可读存储介质
存储器
线性
算法