一种基于渐进式跳跃连接的扩散模型语音增强方法

申请号：CN202510404705

申请日期：2025-04-01

公开号：CN120260600A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了人工智能技术领域，具体涉及一种基于渐进式跳跃连接的扩散模型语音增强方法，以含噪语音和随机采样的标准高斯噪声作为输入，按照设定时间步，利用语音预测器进行采样，得到干净语音；语音预测器包括若干依次设置的残差层；将含噪语音嵌入经投影模块和跳跃连接系数调节得到的条件信息投影至各残差层。本发明将作为条件信息的含躁语音通过跳跃连接输入到语音预测期的各残差层，避免了随着网络深度增加和训练过程中条件信息的优先级被降低，从而有效解决了扩散模型语音增强方法中条件崩溃的问题，并有效提高语音增强的稳定性，增强了泛化能力。

技术关键词

语音投影模块深度神经网络噪声网络深度人工智能技术残差模块采样方法积层编码阶段参数

系统为您推荐了相关专利信息

一种面向高陡区域的雷达分布式散射体干涉测量方法及设备

干涉测量方法影像邻域噪声相位雷达

一种智能话筒辅助用自动化语音识别设备

自动化语音识别智能话筒语音识别模块角度调节机构防护机构

一种水下声呐目标检测系统及方法

光纤水听器阵列水下声呐光纤布拉格光栅传感器光纤水听器单元智能识别模块

一种全口义齿修复后的语音训练系统及数据训练方法

语音训练系统全口义齿修复媒体播放装置发音数据训练方法

一种基于用户情绪分析的工单动态分配方法、装置、介质及设备

多模态信息动态分配方法动态分配装置路径特征文本