一种语音识别方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种语音识别方法、装置、设备及存储介质
申请号:CN202511377844
申请日期:2025-09-25
公开号:CN120998187A
公开日期:2025-11-21
类型:发明专利
摘要
本申请公开了一种语音识别方法、装置、设备及存储介质,涉及人工智能技术领域,包括:基于若干对同音词和近音词构建目标数据集,并基于目标数据集对第一自动语音识别模型进行微调得到第三自动语音识别模型;确定目标音频的声学特征序列,并生成声学特征序列对应的候选词元序列,基于候选词元序列和声学特征序列生成各候选词元的熵值;将高于预设阈值的熵值对应的候选词元确定为待修正词元,若待修正词元对应的错误类型为术语错误,则基于目标领域知识库对待修正词元进行修正;若待修正词元对应的错误类型为歧义错误,则利用第三自动语音识别模型对待修正词元进行修正,基于修正结果确定语音识别结果。本申请可以提升语音识别的准确性和效率。
技术关键词
自动语音识别 语音识别方法 声学特征 解码器 序列 音频 后验概率分布 文本 术语 矩阵 梅尔频率倒谱系数 大语言模型 语音识别装置 数据 编码器 波形 存储计算机程序 人工智能技术 键值