摘要
本发明提供了一种图像生成方法、装置和电子设备;其中,该方法包括:获取源图像、描述源图像的图像内容的源文本、以及描述目标图像的图像内容的目标文本;生成源图像的图像特征、源文本的第一文本特征以及目标文本的第二文本特征;基于第一文本特征和第二文本特征,对图像特征进行多时间步的去噪处理,直至生成目标图像;其中,针对每个时间步,基于时间步对应的时间参数,确定第一文本特征和第二文本特征的中间文本特征;基于中间文本特征对图像特征进行去噪处理;时间步越靠后,中间文本特征越接近第二文本特征。该方式无需训练模型即可实现图像转换,且图像转换的精确度和效率均较高。