基于句法图构建的文本到语音生成方法、装置及电子设备
申请号:CN202411059713
申请日期:2024-08-05
公开号:CN118588056B
公开日期:2025-03-14
类型:发明专利
摘要
本申请涉及计算机技术领域,公开了一种基于句法图构建的文本到语音生成方法、装置及电子设备,该方法包括获取待处理文本和目标参考语音;根据待处理文本,确定待处理文本对应的文本信息和音素信息;基于文本信息和目标语音生成模型中的目标句法图构建网络,生成待处理文本对应的目标句法图;基于音素信息、边界信息、目标句法图,以及目标语音生成模型中的目标编码网络,生成待处理文本对应的目标字级编码;基于目标字级编码、目标参考语音,以及目标语音生成模型中的目标语音生成网络,生成目标合成语音。本申请实施例提供的文本到语音的方法所生成的目标合成语音具有待处理文本的韵律特征,提高了合成语音的真实性和丰富性。
技术关键词
语音生成模型
文本
语音生成方法
编码
节点
网络
韵律特征
字符
样本
关系
风格
电子设备
处理器
生成装置
数据
解析器
模块
可读存储介质
程序