基于特征金字塔注意力的动态残差神经网络声源定位方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于特征金字塔注意力的动态残差神经网络声源定位方法
申请号:CN202510475203
申请日期:2025-04-16
公开号:CN120375857A
公开日期:2025-07-25
类型:发明专利
摘要
本发明提出一种基于特征金字塔注意力的动态残差神经网络声源定位方法,通过动态卷积和注意力机制,结合局部卷积特征与全局上下文信息,提升了声音事件定位与检测的精度和鲁棒性。采用动态残差卷积网络作为骨干网络,将残差动态卷积替代了标准卷积,以增强特征提取能力;特征金字塔注意力模块通过三个子模块细化并整合骨干网络输出的特征图,这三个子模块包括维度对齐模块、金字塔空间注意力模块、金字塔通道注意力模块。在此基础上,模型引入双向门控循环单元用于增强对上下文信息的建模能力。最后,经过全连接层输出最终结果。
技术关键词
特征金字塔 声源定位方法 残差神经网络 注意力 门控循环单元 动态 短时傅里叶变换 对齐模块 多层次特征提取 加权特征 通道 网络模块 损失函数优化 多层级特征 特征提取能力 特征值 全局平均池化
系统为您推荐了相关专利信息
决策方法 无人机 数据 误差加权 表达式
图像修复方法 图像重建 识别器 编码器 解码器
工业仿真 数字孪生模型 仿真方法 数字孪生仿真系统 物理
池化特征 道路交通信号控制方法 道路交通信号控制装置 注意力 信号灯
交叉注意力机制 文本 设计特征 图像像素 多模态