一种基于预训练模型和图神经网络的咳嗽声识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于预训练模型和图神经网络的咳嗽声识别方法
申请号:CN202510001150
申请日期:2025-01-02
公开号:CN119889366A
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开了一种基于预训练模型和图神经网络的咳嗽声识别方法,属于人工智能辅助诊断领域。该方法具体包括:构建包含咳嗽声与非咳嗽声的音频数据集;对音频数据进行静音去除,然后按照固定长度分割成咳嗽声、非咳嗽声片段;对声音片段按照一定帧长、帧移分帧,每帧音频利用预训练模型提取特征;以音频片段每帧特征为图中结点生成节点特征矩阵,以不同帧之间的关系构建邻接矩阵,生成音频片段图数据;对咳嗽、非咳嗽片段图数据按照一定比例划分训练测试集,将图数据输入图神经网络模型中,对图神经网络模型训练,利用训练后的图神经网络模型对咳嗽声进行识别。本发明的方法,利用图神经网络技术,根据输入数据的特性灵活的学习不同时间段和频率段的相关性,提高模型的表达能力,实现更高精度的咳嗽声识别。
技术关键词
预训练模型 识别方法 音频 神经网络模型训练 节点特征 咳嗽 数据 嵌入特征 人工智能辅助 神经网络技术 矩阵 麦克风 结点 场景 关系 注意力 时间段