一种基于注意力机制的ResNet声源定位方法

申请号：CN202510308744

申请日期：2025-03-17

公开号：CN120161409A

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开了一种基于注意力机制的ResNet声源定位方法，涉及声源定位技术领域；其包括如下步骤：获取声源信号，声源信号包括麦克风阵列中每一麦克风的声源信号，将声源信号经短时傅里叶变换至频域，在频域内提取获得麦克风声源信号的相位分量，将每两个麦克风之间的相位分量做差得到相位差，将相位差图馈入训练好的基于改进注意力机制的残差网络，网络输出声源角度预测概率；残差网络包括依次连接的ResNet‑34 Stage1～4、第一输出部分、SC‑SEAM模块、ResNet‑34 Stage5、SC‑SEAM模块、第二输出部分、全连接层以及输出层，该残差网络为改进后的神经网络结构，声源定位精度更高，鲁棒性更好。

技术关键词

声源定位方法残差网络通道注意力机制麦克风阵列短时傅里叶变换声源定位技术信号模块神经网络结构输出特征鲁棒性参数幅值因子频率