基于点云引导的三维场景视频编辑方法

申请号：CN202510992666

申请日期：2025-07-18

公开号：CN121000858A

公开日期：2025-11-21

类型：发明专利

摘要

本发明提供了基于点云引导的三维场景视频编辑方法，包括：获取三维场景的原始视频，估计视频的指定帧中场景的三维点云及各视频帧的相机参数；根据指定帧的图像、像素级的掩码和编辑区描述文本，确定指定帧的编辑参考图像；根据编辑参考图像估计指定帧的编辑后深度，得到指定帧对应的编辑后三维点云；根据指定帧的掩码、指定帧的图像对应的编辑前深度图和编辑后深度图，构建用于包围编辑区的三维网格模型，利用三维网格模型将指定帧的掩码传递到其他帧视角下，得到其他帧的掩码；获取根据编辑后三维点云和每帧的相机参数渲染出的每帧的点云渲染图，根据每帧的点云渲染图、图像和掩码以及编辑参考图像，生成每帧的图像编辑结果，拼接为编辑后视频。

技术关键词

三维网格模型视频编辑方法视频生成模型图像编辑工具融合深度图相机变换器控制模块点云深度值场景像素缩放参数图像编码注意力机制