混合语音识别文本的标点预测方法、装置、计算机设备、可读存储介质和程序产品
申请号:CN202411038721
申请日期:2024-07-31
公开号:CN119106658B
公开日期:2025-04-25
类型:发明专利
摘要
本申请涉及一种混合语音识别文本的标点预测方法、装置、计算机设备、可读存储介质和程序产品。通过语种文本识别模型识别语音中的各个语种对应的各个文本段,通过多个语种的文本段样本训练多个标点预测模型,由对应语种的各个标点预测模型根据输入的文本段输出对应的各个标点预测结果,根据各个标点预测结果,在对应的各个文本段中的添加对应的各个标点信息。相较于传统的按照固定语种进行标点添加的方式,本方案通过多个语种的文本段样本训练多个标点预测模型,对混合多个语种的语音进行对应语种的文本段识别,根据文本段的语种,通过对应的标点预测模型对文本段进行标点预测,提高了对混合多种语音的识别文本进行标点预测的准确度。
技术关键词
文本识别模型
字符
语音活动检测系统
混合语音识别
标点预测方法
文字词典
概率分布函数
条件随机场
序列
样本
计算机设备
可读存储介质
计算机程序产品
处理器
预测装置
模块
存储器