语音合成方法、装置、计算机设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语音合成方法、装置、计算机设备及存储介质
申请号:CN202411721193
申请日期:2024-11-27
公开号:CN119559928A
公开日期:2025-03-04
类型:发明专利
摘要
本发明涉及语音合成技术领域,公开了一种语音合成方法、装置、计算机设备及存储介质,其方法通过获取参考语音数据和待合成文本;通过预设韵律编码器对参考语音数据进行编码处理,获得韵律嵌入向量;通过预设语音识别模型对参考语音数据进行特征提取处理,获得补偿特征向量;通过预设韵律补偿编码器对补偿特征向量进行编码处理,获得韵律补偿向量;对韵律嵌入向量和韵律补偿向量进行融合,获得韵律特征向量;通过预设语音合成模型对待合成文本和韵律特征向量进行合成处理,生成目标合成语音。本发明通过韵律嵌入和韵律补偿辅助语音合成,减小了韵律信息的损失,提高了语音合成效果,在金融服务业务场景中体现智能化和人性化服务,提升用户体验。
技术关键词
语音识别模型 编码向量 计算机可读指令 文本编码器 频谱特征 训练样本数据 注意力 金融服务业务 计算机设备 编码模块 处理器 可读存储介质 生成语音 数据获取模块 解码器