离线语音数据的处理方法及装置、设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
离线语音数据的处理方法及装置、设备和存储介质
申请号:CN202511024911
申请日期:2025-07-24
公开号:CN120977293A
公开日期:2025-11-18
类型:发明专利
摘要
本申请涉及一种离线语音数据的处理方法及装置、设备和存储介质,其中,该方法包括:利用麦克风阵列进行语音数据的多样化采集;对采集到的语音数据进行自适应滤波降噪,并对降噪处理后的语音数据进行端点检测以确定出语音数据中的语音起点和语音终点,以及对进行端点检测后的语音数据中的连续数据进行分帧加窗,最后从分帧加窗后的数据中进行梅尔频率倒谱系数和高阶特征提取并融合,得到预处理后的语音数据;基于预处理后的语音数据对语音识别模型进行训练;对训练后的语音识别模型通过模型剪枝和低秩分解,以及参数进行共享,最后对进行参数共享后的语音识别模型进行重训练;基于重训练后的语音识别模型对实时输入的离线语音数据进行处理。
技术关键词
语音识别模型 长短期记忆网络 梅尔频率倒谱系数 数据 麦克风阵列 模型剪枝 指向麦克风 离线 端点 计算机可执行指令 重构 滤波器 注意力 输出特征 终点 通信接口 参数 冗余
系统为您推荐了相关专利信息
三维模型显示方法 隧洞工程 三维展示系统 拆分规则 控制终端
网格特征 特征提取网络 区域候选网络 多传感器 门控循环单元
隐私保护数据共享 密钥扩展方法 共识算法 解密密钥 分布式存储系统
动态回归模型 补偿值 序列 检验方法 加药泵
人机交互方法 神经网络参数 神经网络训练 仿真环境 均衡策略