语音识别方法和装置、电子设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语音识别方法和装置、电子设备及存储介质
申请号:CN202411465060
申请日期:2024-10-18
公开号:CN119360845B
公开日期:2025-12-09
类型:发明专利
摘要
本申请提供了一种语音识别方法和装置、电子设备及存储介质,属于金融科技技术领域。方法包括:获取包含多个说话人的目标语音数据;基于语音识别模型对目标语音数据进行编码处理,得到语音编码特征,语音识别模型包括语音识别网络、和说话人识别网络;基于语音识别网络对语音编码特征进行内容识别,得到目标语音数据对应的语音文本内容;基于说话人识别网络对目标语音数据、和语音编码特征进行说话人识别,得到目标语音数据对应的说话人声纹特征;基于说话人声纹特征,对语音文本内容中的各个文本字符进行分类,得到每个说话人所产生的目标语音内容,目标语音内容由多个文本字符组成。本申请能够提高对包含多个说话人的语音的识别准确性。
技术关键词
声纹特征 说话人识别 语音识别网络 语音编码 语音识别方法 语音识别模型 样本 文本 字符 数据 解码器 音频编码 语音识别装置 编码特征 金融科技技术 电子设备 标识