一种基于扩散模型可推广的布局到图像生成方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于扩散模型可推广的布局到图像生成方法
申请号:
CN202411847228
申请日期:
2024-12-16
公开号:
CN119722869B
公开日期:
2025-11-04
类型:
发明专利
摘要
本发明公开了一种基于扩散模型的可推广的布局到图像生成方法,其特点是该方法包括:构建符合自然语言表达的布局‑文本‑图片数据集;获取图像特征、文本特征和噪声图像特征;生成用于训练的语义布局特征;计算损失更新语义布局编码器参数;给定布局‑文本信息生成图片等步骤。本发明与现有技术相比具有可推广其他微调后的扩散模型上的能力,直接应用到使用个性化数据集进行微调后的扩散模型上,通过布局生成个性化的图片,并可以与其他基于扩散模型的可控生成方法一起使用,方法便捷,效果优异,具有良好的应用前景。
技术关键词
注意力地图
布局特征
图像生成方法
语义
噪声图像
图片
文本编码器
自然语言
大语言模型
生成图像特征
交叉注意力机制
多模态
编码器参数
图像编码器
系统为您推荐了相关专利信息
1
基于双重语义对齐的中英双语中草药和靶点实体识别方法
实体识别方法
中草药
语义
编码器
多语言
2
一种基于文本引导与多尺度融合的单目深度估计方法及系统
单目深度估计方法
图像
文本
视觉特征
残差信息
3
一种自动泊车导航地图的构建方法及系统
自动泊车
语义点云
矢量地图
视觉
接口模块
4
一种基于大语言模型的问答软件测试方法、装置及设备
大语言模型
软件测试方法
答案
文本
软件测试模块
5
一种应用于复杂天气条件下的无监督图像恢复方法
图像恢复方法
天气
恢复出清晰图像
特征提取模块
网络结构