宠物视觉数据生成方法、装置、计算机设备及存储介质

申请号：CN202511453924

申请日期：2025-10-13

公开号：CN120953421A

公开日期：2025-11-14

类型：发明专利

摘要

本申请实施例提供了一种宠物视觉数据生成方法、装置、计算机设备及存储介质。方法包括接收数据生成请求，数据生成请求包括视觉提示文本和目标宠物的参考视觉数据；根据数据生成请求调用预训练的生成模型，其中，生成模型包括数据融合子模型和视觉处理子模型；调用数据融合子模型基于视觉提示文本和参考视觉数据进行数据融合，得到视觉潜在向量；调用视觉处理子模型基于视觉潜在向量进行视觉数据生成，得到与视觉提示文本对应的目标视觉数据，目标视觉数据包括目标宠物图像和/或目标宠物视频。该方法可以提高宠物视觉数据生成的一致性。

技术关键词

数据生成方法样本视频分辨率计算机设备文本编码器图像编码器噪声解码器计算机程序产品视觉特征提取数据生成装置语义特征提取多模态处理器