摘要
一种语义拼接方法、系统、电子设备及存储介质,涉及数据处理技术领域。该方法包括:对原始文档进行语义边界识别并切分为文本单元,然后构建包含局部语义、全局语义和结构关联特征的多维语义特征矩阵,通过加权融合生成复合语义向量。当接收到用户查询时,从查询文本中提取关键词和语法结构形成带意图权重的增强查询向量,计算与复合语义向量的余弦相似度来筛选候选文本片段。接着基于位置索引信息查找相邻文本片段,计算语义连贯度以确定待拼接片段,最后按位置顺序将候选片段与待拼接片段进行文本拼接并去重,从而生成上下文连贯的复合文本片段。实施本申请提供的技术方案,能够对文本进行智能拼接,从而提高上下文的连贯性。