视频生成方法、模型训练方法、装置及计算机程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
视频生成方法、模型训练方法、装置及计算机程序产品
申请号:CN202510538730
申请日期:2025-04-27
公开号:CN120658921A
公开日期:2025-09-16
类型:发明专利
摘要
本申请公开了一种视频生成方法、模型训练方法、装置及计算机程序产品,视频生成方法包括:获取用于生成视频的目标音频以及参考图片,参考图片中包括发声对象;根据目标音频对应的一个或多个音频片段的片段特征以及参考图像,确定音频片段对应的各待生成视频帧的全局视觉特征;根据目标音频各音频帧的发音特征以及参考图片中发声对象的唇部特征,确定音频帧对应的待生成视频帧中发声对象的唇部特征;根据待生成视频帧对应的唇部特征和全局视觉特征,生成各视频帧。通过本申请提供的方案既能够使得所生成的视频中人物的表达更加生动自然,也能够很准确地使得唇部动作和音频同步,提高用户的视觉体验。
技术关键词
全局视觉特征 唇部特征 音频 视频生成方法 发声 发音特征 视频帧 视频生成模型 对象 图片 样本 计算机程序产品 模型训练方法 图像 脸部特征 视频生成装置 关键点 基础
系统为您推荐了相关专利信息
音频 序列 计算机可执行指令 计算机程序产品 处理器
音频特征 声音事件检测方法 特征提取网络 事件检测模型 交叉注意力机制
数据处理模块 输出放大器 高通滤波器 音频 探测器
教师课堂教学 视频帧信息 多视角 反馈方法 音频
语音特征 回复信息生成方法 声学特征 对象 偏好特征