一种基于大模型的语音多指令并行识别方法及装置

申请号：CN202511139280

申请日期：2025-08-14

公开号：CN120877731A

公开日期：2025-10-31

类型：发明专利

摘要

一种基于大模型的语音多指令并行识别方法及装置，通过对获取的用户语音信号进行分帧处理，并提取多尺度语音特征，获得多尺度语音特征序列；再通过多尺度语音特征序列捕捉语音流中的指令边界信息，完成语音序列分割，生成多个候选指令片段；再将所述候选指令片段并行输入至预训练的大模型，结合语音特征与语言知识进行语义理解，输出初步指令识别结果；基于预设的知识图谱对所述初步指令识别结果进行逻辑关系推理，通过图神经网络计算各指令的最终置信度，进而对初步结果进行筛选、排序与优化，输出最终的多指令识别结果；采用以上步骤实现对语音多指令的高效并行识别，准确捕捉指令语义和逻辑关系，提高语音交互的效率和准确性。

技术关键词

并行识别方法语音特征指令多尺度语义序列图谱关系梅尔频率倒谱系数信号语音采集模块命令语音识别模块节点大语言模型注意力机制背景噪声识别装置