基于句法图构建的文本到语音生成方法、装置及电子设备

申请号：CN202411059713

申请日期：2024-08-05

公开号：CN118588056B

公开日期：2025-03-14

类型：发明专利

摘要

本申请涉及计算机技术领域，公开了一种基于句法图构建的文本到语音生成方法、装置及电子设备，该方法包括获取待处理文本和目标参考语音；根据待处理文本，确定待处理文本对应的文本信息和音素信息；基于文本信息和目标语音生成模型中的目标句法图构建网络，生成待处理文本对应的目标句法图；基于音素信息、边界信息、目标句法图，以及目标语音生成模型中的目标编码网络，生成待处理文本对应的目标字级编码；基于目标字级编码、目标参考语音，以及目标语音生成模型中的目标语音生成网络，生成目标合成语音。本申请实施例提供的文本到语音的方法所生成的目标合成语音具有待处理文本的韵律特征，提高了合成语音的真实性和丰富性。

技术关键词

语音生成模型文本语音生成方法编码节点网络韵律特征字符样本关系风格电子设备处理器生成装置数据解析器模块可读存储介质程序