图像生成模型的训练方法、图像生成方法、装置、计算机设备、存储介质和程序产品
申请号:CN202510274915
申请日期:2025-03-10
公开号:CN120298819A
公开日期:2025-07-11
类型:发明专利
摘要
本申请涉及一种图像生成模型的训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取参考图像样本、目标图像样本和目标图像样本的文本描述样本;将参考图像样本、目标图像样本、目标图像样本的对象姿态信息和文本描述样本输入待训练的图像生成模型,通过图像生成模型对目标图像样本进行加噪处理,生成加噪后图像,并提取出参考图像样本的对象区域特征、目标图像样本的对象姿态特征和文本描述样本的文本特征;基于对象区域特征、对象姿态特征和文本特征,引导图像生成模型对加噪后图像进行噪声预测,得到降噪后图像;根据加噪后图像和降噪后图像,对图像生成模型进行训练。采用本方法能够提高图像生成模型生成图像的精准度。
技术关键词
图像生成模型
样本
姿态特征
对象
噪声预测
图像生成方法
计算机设备
计算机程序产品
编码特征
图像生成装置
文本编码器
图像编码器
处理器
注意力
模块
训练装置