摘要
一种基于大模型的语音多指令并行识别方法及装置,通过对获取的用户语音信号进行分帧处理,并提取多尺度语音特征,获得多尺度语音特征序列;再通过多尺度语音特征序列捕捉语音流中的指令边界信息,完成语音序列分割,生成多个候选指令片段;再将所述候选指令片段并行输入至预训练的大模型,结合语音特征与语言知识进行语义理解,输出初步指令识别结果;基于预设的知识图谱对所述初步指令识别结果进行逻辑关系推理,通过图神经网络计算各指令的最终置信度,进而对初步结果进行筛选、排序与优化,输出最终的多指令识别结果;采用以上步骤实现对语音多指令的高效并行识别,准确捕捉指令语义和逻辑关系,提高语音交互的效率和准确性。