融合声学特征和深度学习特征的蛋鸡声音识别方法及系统

申请号：CN202510515901

申请日期：2025-04-23

公开号：CN120472912A

公开日期：2025-08-12

类型：发明专利

摘要

本发明提供一种融合声学特征和深度学习特征的蛋鸡声音识别方法及系统，包括：获取待识别的原始音频信号和声音识别模型；其中，声音识别模型包括特征提取网络、特征融合网络和分类识别网络；利用特征提取网络对原始音频信号进行特征提取，得到频谱图特征、梅尔频率倒谱系数特征和深层语音特征；特征融合网络利用协同注意力机制或多头注意力机制将频谱图特征、梅尔频率倒谱系数特征和深层语音特征进行特征融合，得到融合后的特征；将融合后的特征输入分类识别网络，得到声音识别结果。本发明能够充分利用各种特征的优势，从多个角度对声音信号进行描述和分析，从而更准确地识别蛋鸡的声纹，显著提高蛋鸡声纹识别的准确率。

技术关键词

梅尔频率倒谱系数融合声学特征声音识别方法深度学习特征语音特征特征提取网络特征融合网络蛋鸡协同注意力音频多头注意力机制双向长短期记忆网络深度学习模型非暂态计算机可读存储介质滤波器声音识别系统信号获取模块

系统为您推荐了相关专利信息

离线语音数据的处理方法及装置、设备和存储介质

语音识别模型长短期记忆网络梅尔频率倒谱系数数据麦克风阵列

一种基于DCCA的多模态融合阻塞性睡眠呼吸暂停识别方法

阻塞性睡眠呼吸暂停融合特征面部关键点语音特征识别方法

局部放电检测方法及装置

光谱特征信息局部放电检测方法局部放电状态声谱矢量量化

基于有限状态机的电网设备状态核对方法

电网设备状态状态机特征值重建误差协方差矩阵

一种基于帧间相似度的伪造语音片段定位方法

定位方法双层卷积神经网络生成语音信号特征提取网络邻域特征