摘要
本发明涉及金融科技技术领域,公开了一种保险业务端的语音合成方法、装置、设备及介质,包括通过将目标文本嵌入特征与声学特征进行拼接融合得到目标拼接特征;将目标拼接特征输入到入预先训练好的语义特征处理模型的编码器中进行下采样操作后,得到目标语义特征;将目标语义特征输入到预先训练好的噪声滤除语音重构模型中,输出得到第一目标语音数据;将第一目标语音数据、目标语义特征和目标拼接特征,输入到预先训练好的语义特征处理模的解码器中得到目标语音。本方案解决了现有的保险业务端的文本到语音转换技术在处理复杂音韵或频繁切换的语音时,容易导致音质下降,从而导致客户在使用智能语音客服进行对话服务时体验度不好的问题。