一种数字人自动讲解静态PPT的视频制作方法

申请号：CN202411978014

申请日期：2024-12-30

公开号：CN119835499A

公开日期：2025-04-15

类型：发明专利

摘要

本申请提供了一种数字人自动讲解静态PPT的视频制作方法、装置、计算机设备和计算机存储介质，涉及视频处理技术领域。包括：从静态PPT的序列图像集合中提取各子图像中的第一目标文本信息；将各子图像中的第一目标文本信息转换为语音，并将得到的各子图像对应的初始音频文件进行合成，得到针对静态PPT的目标音频文件；其中，目标音频文件中各初始音频文件之间添加预设停顿时长，构建各初始音频文件的音频时间与各子图像的展示时间之间的对应关系；在各子图像之间添加预设停顿时长的PPT转场动画，得到针对静态PPT的初始PPT视频；基于目标音频文件控制虚拟数字人对初始PPT视频中的第一目标文本信息进行解说，得到目标PPT视频。该方法可以提高视频播放的流畅度。

技术关键词

视频制作方法文本图像视频制作装置序列音频特征动画面部特征点计算机设备计算机存储介质语音处理器可读存储介质多模态网格关系