混识别的处理方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
混识别的处理方法、装置、设备及存储介质
申请号:CN202410930401
申请日期:2024-07-11
公开号:CN118658475A
公开日期:2024-09-17
类型:发明专利
摘要
本申请涉及语音识别技术领域,提供一种混识别的处理方法、装置、设备及存储介质,方法包括:对输入的语音计算其特征,然后送入语音识别网络,输出一音素概率分布列,同时记录该音素概率分布列的时间戳;将输出的音素概率分布列缓存到一个缓存窗口中;当缓存窗口中新来一音素概率分布列时,基于新来的音素概率分布列的时间戳和缓存窗口中所有音素概率分布列的时间戳确定过期的音素概率分布列;将过期的音素概率分布列从缓存窗口中清理掉,得到清理后的缓存窗口;基于清理后的缓存窗口进行解码操作,获得命令词的识别结果。本申请可以解决重复喊同一命令词容易引起混识别技术问题,提高命令词识别的准确性。
技术关键词
语音识别网络 时间差 命令 语音识别算法 语音识别技术 解码算法 解码模块 处理器 计算机设备 识别模块 可读存储介质 存储器