语音生成方法、模型构建方法、装置、设备、介质和产品

申请号：CN202510013378

申请日期：2025-01-06

公开号：CN119418686A

公开日期：2025-02-11

类型：发明专利

摘要

本发明涉及人工智能技术领域，提供一种语音生成方法、模型构建方法、装置、设备、介质和产品，其中方法包括：确定情感特征参数；基于所述情感特征参数，构建待生成的情感语音的情感向量；将所述情感向量和文本向量输入至已训练的情感语音生成模型，得到所述情感语音生成模型输出的与所述文本向量对应的语音令牌，并基于所述语音令牌生成所述情感语音。本发明提供的语音生成方法、模型构建方法、装置、设备、介质和产品，通过情感特征参数构建待生成的情感语音的情感向量，完成情感的精细化建模，基于情感向量和文本向量，通过情感语音生成模型的强大能力，生成得到的情感语音有很强的情绪表达能力。

技术关键词

语音生成模型语音生成方法大语言模型令牌模型构建方法情感类别样本文本非暂态计算机可读存储介质风格特征提取单元坐标系处理器预训练模型人工智能技术计算机程序产品生成装置参数强度