摘要
一种视频生成方法、装置、介质、设备及计算机程序产品,所述方法包括:获取控制图像和所述控制图像对应的深度图,以及用于视频生成的目标相机轨迹信息;根据所述控制图像、所述深度图、所述目标相机轨迹信息和视频生成模型,对噪声图像特征进行去噪处理,确定所述控制图像对应的目标视频和所述目标视频对应的目标视频深度信息。由此,在通过图像进行视频生成的过程中,可以结合相机轨迹信息和控制图像的深度信息进行视频生成,从而获得在相机轨迹信息控制下的目标视频及其视频深度信息,基于目标视频和视频深度信息可以直接渲染获得3D场景,则可以提高目标视频和相机轨迹信息之间的匹配度,无需复杂的流程和额外操作便可快速获取3D场景。