离线语音数据的处理方法及装置、设备和存储介质

申请号：CN202511024911

申请日期：2025-07-24

公开号：CN120977293A

公开日期：2025-11-18

类型：发明专利

摘要

本申请涉及一种离线语音数据的处理方法及装置、设备和存储介质，其中，该方法包括：利用麦克风阵列进行语音数据的多样化采集；对采集到的语音数据进行自适应滤波降噪，并对降噪处理后的语音数据进行端点检测以确定出语音数据中的语音起点和语音终点，以及对进行端点检测后的语音数据中的连续数据进行分帧加窗，最后从分帧加窗后的数据中进行梅尔频率倒谱系数和高阶特征提取并融合，得到预处理后的语音数据；基于预处理后的语音数据对语音识别模型进行训练；对训练后的语音识别模型通过模型剪枝和低秩分解，以及参数进行共享，最后对进行参数共享后的语音识别模型进行重训练；基于重训练后的语音识别模型对实时输入的离线语音数据进行处理。

技术关键词

语音识别模型长短期记忆网络梅尔频率倒谱系数数据麦克风阵列模型剪枝指向麦克风离线端点计算机可执行指令重构滤波器注意力输出特征终点通信接口参数冗余

系统为您推荐了相关专利信息

一种隧洞工程三维模型显示方法、系统、设备及存储介质

三维模型显示方法隧洞工程三维展示系统拆分规则控制终端

一种基于多传感器数据时空特征聚合的联合目标检测与跟踪方法

网格特征特征提取网络区域候选网络多传感器门控循环单元

一种基于区块链的多层级隐私保护数据共享方法及系统

隐私保护数据共享密钥扩展方法共识算法解密密钥分布式存储系统

一种基于NO3--N前馈调节和N2O反馈优化的碳源精准投加自控制方法

动态回归模型补偿值序列检验方法加药泵

一种基于决策者偏好的人机交互方法

人机交互方法神经网络参数神经网络训练仿真环境均衡策略