一种语音识别方法及相关装置、设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种语音识别方法及相关装置、设备和存储介质
申请号:CN202411007495
申请日期:2024-07-25
公开号:CN118982986A
公开日期:2024-11-19
类型:发明专利
摘要
本申请公开了一种语音识别方法及相关装置、设备和存储介质,其中,语音识别方法包括:基于待识别语音的语音特征,得到声学编码特征、帧级发音特征和段级发音特征;基于声学编码特征进行预测,得到待识别语音的预测发音序列,并基于预测发音序列,提取得到文本编码特征;获取声学编码特征与帧级发音特征的第一融合特征,并获取文本编码特征与段级发音特征的第二融合特征;基于第一融合特征和第二融合特征进行解码,得到待识别语音的语音识别文本。上述方案,能够提升语音识别的准确性。
技术关键词
编码特征 发音特征 融合特征 语音识别模型 样本 语音识别文本 语音识别方法 序列 语音特征 解码模型 度量 嵌入特征 交叉注意力机制 元素 语音识别装置
系统为您推荐了相关专利信息
三维卷积神经网络 图像分割方法 概率密度函数 图像分割系统 最大化方法
风险预测方法 智能化建筑 风险预测模型 协方差矩阵 样本
投加控制方法 随机森林模型 加药 投加控制系统 周期
合成塔 模糊控制规则 变量 可执行程序代码 温度控制方法