基于元数据增强的语音识别模型预训练方法、语音识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于元数据增强的语音识别模型预训练方法、语音识别方法及系统
申请号:CN202510356445
申请日期:2025-03-25
公开号:CN120260548A
公开日期:2025-07-04
类型:发明专利
摘要
本发明涉及语音识别技术,提供一种基于元数据增强的语音识别模型预训练方法、语音识别方法及系统。其中语音识别模型预训练方法包括:获取语音识别数据集,所述语音识别数据集由不同语种的语音‑文本对组成,从所述语音识别数据集中N种语种中采样N个任务以形成批次数据集,将所述批次数据集中的每个任务分为支持集和查询集;基于所述批次数据集对语音识别模型进行元训练,提取训练过程中在所述语音识别模型的指定隐藏层中的批次数据集并进行数据扰动,得到扰动数据集;对应的,所述扰动数据集中每个任务包含扰动支持集和扰动查询集;将所述批次数据集和所述扰动数据集进行混合增强后对每个语种进行训练并更新所述语音识别模型参数。
技术关键词
语音识别模型 预训练方法 数据 编码器适配器 语音识别方法 文本 语音特征 参数 语音识别系统 语音识别技术 语音识别模块 模型训练模块 样本 处理器 存储器 非线性 电子设备