融合声学特征和深度学习特征的蛋鸡声音识别方法及系统
申请号:CN202510515901
申请日期:2025-04-23
公开号:CN120472912A
公开日期:2025-08-12
类型:发明专利
摘要
本发明提供一种融合声学特征和深度学习特征的蛋鸡声音识别方法及系统,包括:获取待识别的原始音频信号和声音识别模型;其中,声音识别模型包括特征提取网络、特征融合网络和分类识别网络;利用特征提取网络对原始音频信号进行特征提取,得到频谱图特征、梅尔频率倒谱系数特征和深层语音特征;特征融合网络利用协同注意力机制或多头注意力机制将频谱图特征、梅尔频率倒谱系数特征和深层语音特征进行特征融合,得到融合后的特征;将融合后的特征输入分类识别网络,得到声音识别结果。本发明能够充分利用各种特征的优势,从多个角度对声音信号进行描述和分析,从而更准确地识别蛋鸡的声纹,显著提高蛋鸡声纹识别的准确率。
技术关键词
梅尔频率倒谱系数
融合声学特征
声音识别方法
深度学习特征
语音特征
特征提取网络
特征融合网络
蛋鸡
协同注意力
音频
多头注意力机制
双向长短期记忆网络
深度学习模型
非暂态计算机可读存储介质
滤波器
声音识别系统
信号获取模块