语音生成方法、模型构建方法、装置、设备、介质和产品
申请号:CN202510013378
申请日期:2025-01-06
公开号:CN119418686A
公开日期:2025-02-11
类型:发明专利
摘要
本发明涉及人工智能技术领域,提供一种语音生成方法、模型构建方法、装置、设备、介质和产品,其中方法包括:确定情感特征参数;基于所述情感特征参数,构建待生成的情感语音的情感向量;将所述情感向量和文本向量输入至已训练的情感语音生成模型,得到所述情感语音生成模型输出的与所述文本向量对应的语音令牌,并基于所述语音令牌生成所述情感语音。本发明提供的语音生成方法、模型构建方法、装置、设备、介质和产品,通过情感特征参数构建待生成的情感语音的情感向量,完成情感的精细化建模,基于情感向量和文本向量,通过情感语音生成模型的强大能力,生成得到的情感语音有很强的情绪表达能力。
技术关键词
语音生成模型
语音生成方法
大语言模型
令牌
模型构建方法
情感类别
样本
文本
非暂态计算机可读存储介质
风格
特征提取单元
坐标系
处理器
预训练模型
人工智能技术
计算机程序产品
生成装置
参数
强度