一种基于预训练模型和图神经网络的咳嗽声识别方法

申请号：CN202510001150

申请日期：2025-01-02

公开号：CN119889366A

公开日期：2025-04-25

类型：发明专利

摘要

本发明公开了一种基于预训练模型和图神经网络的咳嗽声识别方法，属于人工智能辅助诊断领域。该方法具体包括：构建包含咳嗽声与非咳嗽声的音频数据集；对音频数据进行静音去除，然后按照固定长度分割成咳嗽声、非咳嗽声片段；对声音片段按照一定帧长、帧移分帧，每帧音频利用预训练模型提取特征；以音频片段每帧特征为图中结点生成节点特征矩阵，以不同帧之间的关系构建邻接矩阵，生成音频片段图数据；对咳嗽、非咳嗽片段图数据按照一定比例划分训练测试集，将图数据输入图神经网络模型中，对图神经网络模型训练，利用训练后的图神经网络模型对咳嗽声进行识别。本发明的方法，利用图神经网络技术，根据输入数据的特性灵活的学习不同时间段和频率段的相关性，提高模型的表达能力，实现更高精度的咳嗽声识别。

技术关键词

预训练模型识别方法音频神经网络模型训练节点特征咳嗽数据嵌入特征人工智能辅助神经网络技术矩阵麦克风结点场景关系注意力时间段