融合状态空间建模与语义引导的视频补全方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
融合状态空间建模与语义引导的视频补全方法
申请号:CN202510862271
申请日期:2025-06-25
公开号:CN120765695A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了融合状态空间建模与语义引导的视频补全方法,涉及视频处理技术领域。本发明提出一种融合状态空间建模与语义引导机制的视频补全框架,命名为SAGE‑VI(State‑Aware and Guided Enhancement forVideo Inpainting),该框架由两个阶段组成:像素传播阶段与语义引导的参考生成阶段;在像素传播阶段,框架采用状态空间建模机制增强光流补全中的时序感知与结构一致性,从而提高像素传播的稳定性;在语义引导阶段,设计参考生成模块,结合图像特征构建区域级语义提示,引导缺失区域的内容生成,提升细节还原质量与语义合理性;在HQVI数据集上的实验结果表明,SAGE‑VI在定量指标和视觉质量方面均优于现有主流方法,验证了其在复杂场景下的补全性能与泛化能力。
技术关键词
视频补全方法 像素 图像融合策略 生成结构 序列 阶段 一致性检测 模块 图像生成器 有效性 融合语义 框架 时序 生成机制 矩阵 注意力机制