摘要
本申请实施例提供了一种宠物视觉数据生成方法、装置、计算机设备及存储介质。方法包括接收数据生成请求,数据生成请求包括视觉提示文本和目标宠物的参考视觉数据;根据数据生成请求调用预训练的生成模型,其中,生成模型包括数据融合子模型和视觉处理子模型;调用数据融合子模型基于视觉提示文本和参考视觉数据进行数据融合,得到视觉潜在向量;调用视觉处理子模型基于视觉潜在向量进行视觉数据生成,得到与视觉提示文本对应的目标视觉数据,目标视觉数据包括目标宠物图像和/或目标宠物视频。该方法可以提高宠物视觉数据生成的一致性。