摘要
本申请涉及一种离线语音数据的处理方法及装置、设备和存储介质,其中,该方法包括:利用麦克风阵列进行语音数据的多样化采集;对采集到的语音数据进行自适应滤波降噪,并对降噪处理后的语音数据进行端点检测以确定出语音数据中的语音起点和语音终点,以及对进行端点检测后的语音数据中的连续数据进行分帧加窗,最后从分帧加窗后的数据中进行梅尔频率倒谱系数和高阶特征提取并融合,得到预处理后的语音数据;基于预处理后的语音数据对语音识别模型进行训练;对训练后的语音识别模型通过模型剪枝和低秩分解,以及参数进行共享,最后对进行参数共享后的语音识别模型进行重训练;基于重训练后的语音识别模型对实时输入的离线语音数据进行处理。