混合语音识别文本的标点预测方法、装置、计算机设备、可读存储介质和程序产品

申请号：CN202411038721

申请日期：2024-07-31

公开号：CN119106658B

公开日期：2025-04-25

类型：发明专利

摘要

本申请涉及一种混合语音识别文本的标点预测方法、装置、计算机设备、可读存储介质和程序产品。通过语种文本识别模型识别语音中的各个语种对应的各个文本段，通过多个语种的文本段样本训练多个标点预测模型，由对应语种的各个标点预测模型根据输入的文本段输出对应的各个标点预测结果，根据各个标点预测结果，在对应的各个文本段中的添加对应的各个标点信息。相较于传统的按照固定语种进行标点添加的方式，本方案通过多个语种的文本段样本训练多个标点预测模型，对混合多个语种的语音进行对应语种的文本段识别，根据文本段的语种，通过对应的标点预测模型对文本段进行标点预测，提高了对混合多种语音的识别文本进行标点预测的准确度。

技术关键词

文本识别模型字符语音活动检测系统混合语音识别标点预测方法文字词典概率分布函数条件随机场序列样本计算机设备可读存储介质计算机程序产品处理器预测装置模块存储器