一种特定人物的视频生成方法、装置、设备及介质

申请号：CN202411974178

申请日期：2024-12-30

公开号：CN119815147A

公开日期：2025-04-11

类型：发明专利

摘要

本发明公开了一种特定人物的视频生成方法、装置、设备及介质。该方法包括：根据用户输入的待生成视频的视频提示词以及目标人物的人脸图像，分别获取提示词文本生成特征以及抽象人脸面部特征；通过多模态变压器扩散生成模型，对提示词文本生成特征以及抽象人脸面部特征进行多轮处理，获取目标人物相关图像；其中，多模态变压器扩散生成模型中通过跨注意力机制实现特征融合；根据目标人物相关图像，生成特定人物视频。采用上述技术方案，能够实现仅需单张人物图像，即可生成特定人物视频，算力消耗低，耗时较短，能够高效、便捷的获取特定人物的视频，提高用户的使用体验。

技术关键词

人脸面部特征生成特征视频生成方法文本多模态视频生成模型人脸特征人脸图像识别注意力机制多层感知机变压器预训练模型视频生成装置图像获取模块处理器可读存储介质特征提取模块

系统为您推荐了相关专利信息

漏洞知识图谱的构建方法及装置、电子设备

超文本传输协议请求验证规则概念载荷计算机可执行指令

一种基于循环神经网络的语音识别方法及系统

语音特征语音识别方法信噪比差值梅尔频率倒谱系数带噪语音信号

一种基于终身学习的可微医学跨模态哈希检索方法

文本图像视觉特征样本数据医学

一种融合物理先验与时空演化的遥感图像海洋绿潮监测方法及系统

海洋动力学辐射传输模型动态邻接矩阵卷积特征监测方法

一种大语言模型驱动的无人机图像语义传输与问答系统和方法

大语言模型问答系统无人机字幕图像语义提取