基于用户特定时域包络重构的个性化语音降噪与增强方法
申请号:CN202510613176
申请日期:2025-05-13
公开号:CN120496558A
公开日期:2025-08-15
类型:发明专利
摘要
本发明公开了一种基于用户特定时域包络重构的个性化语音降噪与增强方法,涉及语音信号处理领域,包括如下步骤:在用户使用耳机进行日常通话或语音输入过程中,实时监测环境噪声水平,当监测到环境噪声水平低于预设的噪声阈值时,将用户此时的语音信号自动采集为低噪声环境语音样本;对该语音样本进行音素级切分并提取时域包络建立目标包络数据库;实时处理时通过动态时间规整算法比对包络差异,生成局部增益修正参数进行动态增益调节,获得增强后的实时语音信号。本发明解决了传统降噪方法语音失真和个性化不足的问题。
技术关键词
个性化语音
实时语音
包络
动态时间规整算法
短时傅里叶变换
低噪声
引入注意力机制
语音信号处理
参数
降噪方法
重构
样本
通道
滑动窗口
耳机
滤波