一种语音识别方法及相关装置、设备和存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种语音识别方法及相关装置、设备和存储介质
申请号:
CN202411007495
申请日期:
2024-07-25
公开号:
CN118982986A
公开日期:
2024-11-19
类型:
发明专利
摘要
本申请公开了一种语音识别方法及相关装置、设备和存储介质,其中,语音识别方法包括:基于待识别语音的语音特征,得到声学编码特征、帧级发音特征和段级发音特征;基于声学编码特征进行预测,得到待识别语音的预测发音序列,并基于预测发音序列,提取得到文本编码特征;获取声学编码特征与帧级发音特征的第一融合特征,并获取文本编码特征与段级发音特征的第二融合特征;基于第一融合特征和第二融合特征进行解码,得到待识别语音的语音识别文本。上述方案,能够提升语音识别的准确性。
技术关键词
编码特征
发音特征
融合特征
语音识别模型
样本
语音识别文本
语音识别方法
序列
语音特征
解码模型
度量
嵌入特征
交叉注意力机制
元素
语音识别装置
系统为您推荐了相关专利信息
1
基于缺失模态的多模态图像分割方法、系统、终端及存储介质
三维卷积神经网络
图像分割方法
概率密度函数
图像分割系统
最大化方法
2
一种智能化建筑质量风险预测方法
风险预测方法
智能化建筑
风险预测模型
协方差矩阵
样本
3
一种缺氧池碳源精准投加控制系统及方法
投加控制方法
随机森林模型
加药
投加控制系统
周期
4
一种二氧化碳加氢合成甲醇工艺反应温度控制方法及系统
合成塔
模糊控制规则
变量
可执行程序代码
温度控制方法
5
词集获取方法、基于词集的智能量测终端应用检测方法、装置、设备和存储介质
接口
智能量测终端
编码
序列
样本