基于多阶局部和全局融合网络的声音事件定位与检测方法
申请号:CN202410747471
申请日期:2024-06-11
公开号:CN118692493A
公开日期:2024-09-24
类型:发明专利
摘要
一种基于多阶局部和全局融合网络的声音事件定位与检测方法,由数据集预处理、特征提取、构建多阶局部和全局融合网络、训练多阶局部和全局融合网络、测试多阶局部和全局融合网络、定位和检测声音事件步骤组成。本发明采用了多阶局部和全局融合网络,提取空间多阶特征信息的同时,使用局部卷积块提取局部特征信息,使用全局Transformer块捕获上下文特征信息,并根据局部特征和上下文特征的重要性进行自适应地融合,增强了特征的多样性,提高了特征的表达能力,克服了卷积循环神经网络提取特征不充分的问题。本发明具有识别准确率高、定位误差小、提取特征信息完整等优点,可用于声音事件定位与检测。
技术关键词
注意力
分支
线性单元
动态
矢量特征
积层
多尺度
度函数
频谱特征
卷积循环神经网络
上下文特征
Softmax函数
笛卡尔
局部特征信息
短时傅里叶变换
门控循环单元
全局平均池化
级联
声音类别