基于多通道语音增强的智能眼镜语音识别方法及系统

申请号：CN202511030544

申请日期：2025-07-25

公开号：CN120526758B

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种基于多通道语音增强的智能眼镜语音识别方法及系统，涉及语音识别技术领域，其技术方案要点包括，获取麦克风阵列中每个麦克风对应的混合信号，混合信号包括多个待识别对象的语音信号；根据每个待识别对象对应的时延，确定每个待识别对象对应的语音信号，时延根据每个待识别对象与麦克风阵列中每个麦克风的距离确定；根据语音信号及对应的待识别对象，得到当前对话信息；根据当前对话信息预测目标声源方向；根据目标声源方向进行语音增强，得到增强语音信号，本发明通过信号分离有效识别出每个发言对象对应的具体内容，基于内容之间的上下文关系预测下一个发言对象，并对该发言对象进行语音增强，解决多人场景中的语音干扰问题。

技术关键词

对象麦克风阵列语音识别方法智能眼镜混合矩阵信号幅值协方差矩阵多通道时延上下文关系预测语义向量语音识别系统频率语音识别技术身份神经网络模型