摘要
本发明公开了一种基于预训练模型和图神经网络的咳嗽声识别方法,属于人工智能辅助诊断领域。该方法具体包括:构建包含咳嗽声与非咳嗽声的音频数据集;对音频数据进行静音去除,然后按照固定长度分割成咳嗽声、非咳嗽声片段;对声音片段按照一定帧长、帧移分帧,每帧音频利用预训练模型提取特征;以音频片段每帧特征为图中结点生成节点特征矩阵,以不同帧之间的关系构建邻接矩阵,生成音频片段图数据;对咳嗽、非咳嗽片段图数据按照一定比例划分训练测试集,将图数据输入图神经网络模型中,对图神经网络模型训练,利用训练后的图神经网络模型对咳嗽声进行识别。本发明的方法,利用图神经网络技术,根据输入数据的特性灵活的学习不同时间段和频率段的相关性,提高模型的表达能力,实现更高精度的咳嗽声识别。