一种视频生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种视频生成方法
申请号:CN202510513724
申请日期:2025-04-23
公开号:CN120166266A
公开日期:2025-06-17
类型:发明专利
摘要
本发明涉及一种视频生成方法,包括:S1、获取待生成视频的条件提示,并通过对齐模型对其内容提示进行重构,得到覆盖场景、动作与摄影机运动的条件内容提示,其中所述条件提示的内容包括文本、音频、图片或视频;S2、利用多模态编码器对所述内容提示进行编码,得到多模态向量嵌入;S3、调用经空间‑时间残差量化处理的视觉自动编码器,对训练集视频进行离线向量量化,获取视频token序列及其编码方式;S4、将视频token序列输入Mate模块,基于短程‑长程解耦空间‑时间注意力与滑动时间窗策略,输出与视频token的数量呈线性关系的表示;S5,将所述多模态向量嵌入与Mate模块输出进行交叉注意力融合,逐步采样得到目标视频token序列,并经解码器复原为完整视频。
技术关键词
视频生成方法 多模态 滑动时间窗 自动编码器 注意力 分支 序列 摄影机 解码器 训练集 文本 分辨率 策略 离线 模块 重构 运动 音频
系统为您推荐了相关专利信息
情绪识别模型 多模态 序列 因子 验证特征
检索报告生成方法 便携式文档格式 语句 网络知识库 检索策略
模型数据处理方法 神经网络模型 矩阵 参数 注意力
政务 智能系统 分布式用户 生成机制 多模态
图像检测方法 编码器 融合特征 样本 图像检测模型