摘要
本发明公开了一种多尺度自适应特征融合的声音事件定位与检测方法,对待检测的多通道音频信号进行预处理,生成Mel谱图并计算有效强度向量,构建输入特征矩阵并输入编码器进行多尺度特征提取,输出多层空间特征;通过选择性频率感知特征融合模块对多层空间特征进行频率自适应调节,平滑全局特征并增强边界细节。使用分层多尺度特征集成模块对浅层特征与深层特征进行融合,并结合双向门控循环单元进行时间建模,输出检测结果。本发明能够解决多源重叠声源干扰、噪声影响下的定位不稳定性、边界模糊引起的检测精度下降问题,以及特征混淆导致的时间频率细节丢失问题,能够显著提升定位和检测性能。