融合状态空间建模与语义引导的视频补全方法

申请号：CN202510862271

申请日期：2025-06-25

公开号：CN120765695A

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了融合状态空间建模与语义引导的视频补全方法，涉及视频处理技术领域。本发明提出一种融合状态空间建模与语义引导机制的视频补全框架，命名为SAGE‑VI(State‑Aware and Guided Enhancement forVideo Inpainting)，该框架由两个阶段组成：像素传播阶段与语义引导的参考生成阶段；在像素传播阶段，框架采用状态空间建模机制增强光流补全中的时序感知与结构一致性，从而提高像素传播的稳定性；在语义引导阶段，设计参考生成模块，结合图像特征构建区域级语义提示，引导缺失区域的内容生成，提升细节还原质量与语义合理性；在HQVI数据集上的实验结果表明，SAGE‑VI在定量指标和视觉质量方面均优于现有主流方法，验证了其在复杂场景下的补全性能与泛化能力。

技术关键词

视频补全方法像素图像融合策略生成结构序列阶段一致性检测模块图像生成器有效性融合语义框架时序生成机制矩阵注意力机制