一种基于3D卷积的生态环境鸟类鸣声识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于3D卷积的生态环境鸟类鸣声识别方法
申请号:CN202411001630
申请日期:2024-07-25
公开号:CN118538226B
公开日期:2024-09-24
类型:发明专利
摘要
本申请涉及语音处理技术领域,具体涉及一种基于3D卷积的生态环境鸟类鸣声识别方法,包括:采集自然环境音频数据,获取有效音频信号,划分滑动窗口,获取每个滑动窗口的信号周期,计算振幅变异因子以及音频结构单调因子,获取鸟鸣置信系数,构建鸟鸣增强信号,计算频域受扰因子以及鸟鸣信号差异因子,获取鸟鸣受扰系数,根据鸟鸣受扰系数以及鸟鸣增强信号中的有效音频信号确定平滑系数,获取鸟类鸣声识别结果。本申请旨在解决传统的维纳滤波算法未考虑到自然环境中音频信号的复杂性导致难以在保留鸟类鸣声细节信息的同时兼顾对自然环境中音频信号的去噪效果的问题。
技术关键词
滑动窗口 周期 能量特征值 识别方法 因子 指数 包络 经验模态分解算法 音频信号分解 序列 深度神经网络 信息熵 频率 语音 矩形 数据 数值