文本相似度检测、文本相似度检测模型的训练方法及装置
申请号:CN202411658722
申请日期:2024-11-19
公开号:CN119647446A
公开日期:2025-03-18
类型:发明专利
摘要
本申请涉及一种文本相似度检测、文本相似度检测模型的训练方法及装置。方法包括:获取第一待测文本和第二待测文本;将第一待测文本和第二待测文本输入文本相似度检测模型,并获取文本相似度检测模型输出的第一待测文本和第二待测文本之间的相似度标签;其中,文本相似度检测模型是通过目标样本数据集训练后生成的,目标样本数据集为提示词工程驱动语言模型对初始语料数据扩充后生成的样本数据集,文本相似度检测模型中包括双向长短期记忆网络LSTM模块和多尺度卷积注意力模块,双向LSTM模块和多尺度卷积注意力模块用于对文本相似度检测模型的输入数据进行特征提取。采用本方法能够提高文本相似度检测准确度。
技术关键词
文本
样本
双向长短期记忆网络
标签
模块
注意力
序列
生成答案
置信度阈值
大语言模型
度检测方法
度检测装置
分类器
计算机程序产品
处理器
数据编码
训练装置
计算机设备
可读存储介质