一种基于深度学习的录播教室语音增强方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于深度学习的录播教室语音增强方法
申请号:CN202411557781
申请日期:2024-11-04
公开号:CN119274566A
公开日期:2025-01-07
类型:发明专利
摘要
本发明公开了一种基于深度学习的录播教室语音增强方法,用于对录播教室内采集的语音信号进行增强处理,以提高录播教室音频清晰度和音频信息可懂度。本发明在传统的深度复卷积神经网络的基础上,提出了一种基于时频长短时记忆网络(F‑T‑LSTM)和混合注意力机制的改进网络结构模型。该模型在深度复卷积递归网络上进行改进,通过引入F‑T‑LSTM结构更加准确地描述语音时域和频域的相关性,并融合通道注意力机制和空间注意力机制形成混合注意力机制,对复数域的语音特征进行更加全面的特征提取,巧妙地将计算力集中于语谱图特征信息最为丰富的领域,从而显著提高复数域下语音增强网络的整体性能,该网络模型具有较好的泛化能力。
技术关键词
录播教室 通道注意力机制 卷积递归网络 专业音频设备 卷积神经网络结构 语音特征 解码器 训练集 数据 深度学习算法 参数 语谱图 编码器 基础结构 级联