在文本到图像扩散模型上学习用于3D感知图像生成的连续控制
申请号:CN202411880093
申请日期:2024-12-19
公开号:CN120472082A
公开日期:2025-08-12
类型:发明专利
摘要
一种用于图像处理的方法、装置、非暂态计算机可读介质和系统,包括获得描述元件的文本提示和元件的连续属性的属性值;嵌入文本提示以获得文本嵌入空间中的文本嵌入;嵌入属性值以获得文本嵌入空间中的属性嵌入;以及基于文本嵌入和属性嵌入生成合成图像,其中合成图像基于属性值描绘元件的连续属性。
技术关键词
图像生成模型
训练集
非暂态计算机可读介质
生成训练图像
令牌
元件
存储器
文本编码器
多层感知器
机器学习模型
对象
参数
图像处理
重构
处理器
噪声
标识