摘要
本发明公开了一种基于注意力机制的ResNet声源定位方法,涉及声源定位技术领域;其包括如下步骤:获取声源信号,声源信号包括麦克风阵列中每一麦克风的声源信号,将声源信号经短时傅里叶变换至频域,在频域内提取获得麦克风声源信号的相位分量,将每两个麦克风之间的相位分量做差得到相位差,将相位差图馈入训练好的基于改进注意力机制的残差网络,网络输出声源角度预测概率;残差网络包括依次连接的ResNet‑34 Stage1~4、第一输出部分、SC‑SEAM模块、ResNet‑34 Stage5、SC‑SEAM模块、第二输出部分、全连接层以及输出层,该残差网络为改进后的神经网络结构,声源定位精度更高,鲁棒性更好。