摘要
本发明提供了基于点云引导的三维场景视频编辑方法,包括:获取三维场景的原始视频,估计视频的指定帧中场景的三维点云及各视频帧的相机参数;根据指定帧的图像、像素级的掩码和编辑区描述文本,确定指定帧的编辑参考图像;根据编辑参考图像估计指定帧的编辑后深度,得到指定帧对应的编辑后三维点云;根据指定帧的掩码、指定帧的图像对应的编辑前深度图和编辑后深度图,构建用于包围编辑区的三维网格模型,利用三维网格模型将指定帧的掩码传递到其他帧视角下,得到其他帧的掩码;获取根据编辑后三维点云和每帧的相机参数渲染出的每帧的点云渲染图,根据每帧的点云渲染图、图像和掩码以及编辑参考图像,生成每帧的图像编辑结果,拼接为编辑后视频。