基于多阶局部和全局融合网络的声音事件定位与检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多阶局部和全局融合网络的声音事件定位与检测方法
申请号:CN202410747471
申请日期:2024-06-11
公开号:CN118692493A
公开日期:2024-09-24
类型:发明专利
摘要
一种基于多阶局部和全局融合网络的声音事件定位与检测方法,由数据集预处理、特征提取、构建多阶局部和全局融合网络、训练多阶局部和全局融合网络、测试多阶局部和全局融合网络、定位和检测声音事件步骤组成。本发明采用了多阶局部和全局融合网络,提取空间多阶特征信息的同时,使用局部卷积块提取局部特征信息,使用全局Transformer块捕获上下文特征信息,并根据局部特征和上下文特征的重要性进行自适应地融合,增强了特征的多样性,提高了特征的表达能力,克服了卷积循环神经网络提取特征不充分的问题。本发明具有识别准确率高、定位误差小、提取特征信息完整等优点,可用于声音事件定位与检测。
技术关键词
注意力 分支 线性单元 动态 矢量特征 积层 多尺度 度函数 频谱特征 卷积循环神经网络 上下文特征 Softmax函数 笛卡尔 局部特征信息 短时傅里叶变换 门控循环单元 全局平均池化 级联 声音类别