一种主备双路音视频流的帧偏移量人工智能预测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种主备双路音视频流的帧偏移量人工智能预测方法
申请号:CN202511042112
申请日期:2025-07-28
公开号:CN120894728A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供一种主备双路音视频流的帧偏移量人工智能预测方法,涉及视频处理技术领域。所述方法包括:对第一视频流和第二视频流进行预处理,获得第一视频帧序列和第二视频帧序列;对第一视频帧序列和第二视频帧序列分别进行特征提取处理,获得第一时空特征图和第二时空特征图;获取第一分区特征向量和第二分区特征向量,并输入时序关系模型,获得时序关系特征信息,并输入多层感知网络模型,获得帧偏移量。根据本发明,可通过对两个视频流进行相同的预处理,降低编码方式不同造成的影响,并且,可通过对视频帧的内容和时序关系进行理解的方式确定帧偏移量,进一步降低视频编码方式不同造成的视频帧差别的影响,提升对齐准确性。
技术关键词
视频帧 多层感知网络 视频流 人工智能预测方法 时序 序列 卷积神经网络模型 交叉注意力机制 层级 关系 人工智能预测系统 计算机程序指令 矩阵 音视频 视频编码方式 融合特征 键值 特征提取模块 分区模块