一种特定人物的视频生成方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种特定人物的视频生成方法、装置、设备及介质
申请号:CN202411974178
申请日期:2024-12-30
公开号:CN119815147A
公开日期:2025-04-11
类型:发明专利
摘要
本发明公开了一种特定人物的视频生成方法、装置、设备及介质。该方法包括:根据用户输入的待生成视频的视频提示词以及目标人物的人脸图像,分别获取提示词文本生成特征以及抽象人脸面部特征;通过多模态变压器扩散生成模型,对提示词文本生成特征以及抽象人脸面部特征进行多轮处理,获取目标人物相关图像;其中,多模态变压器扩散生成模型中通过跨注意力机制实现特征融合;根据目标人物相关图像,生成特定人物视频。采用上述技术方案,能够实现仅需单张人物图像,即可生成特定人物视频,算力消耗低,耗时较短,能够高效、便捷的获取特定人物的视频,提高用户的使用体验。
技术关键词
人脸面部特征 生成特征 视频生成方法 文本 多模态 视频生成模型 人脸特征 人脸图像识别 注意力机制 多层感知机 变压器 预训练模型 视频生成装置 图像获取模块 处理器 可读存储介质 特征提取模块
系统为您推荐了相关专利信息
超文本传输协议请求 验证规则 概念 载荷 计算机可执行指令
语音特征 语音识别方法 信噪比差值 梅尔频率倒谱系数 带噪语音信号
文本 图像视觉特征 样本 数据 医学
海洋动力学 辐射传输模型 动态邻接矩阵 卷积特征 监测方法
大语言模型 问答系统 无人机 字幕 图像语义提取