凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”
6249点击    2025-08-19 21:32

用提示词就能点对点编辑图片?


Qwen:没错,正是在下。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


瞧,上面这套“哪里不对改哪里”的操作,就来自“凌晨战神”Qwen团队最新发布的——Qwen-Image-Edit


作为Qwen-Image20B的图像编辑版,Qwen-Image-Edit除了能做上面这种精准的文字修改,还能够新增、消除、重绘、修改元素,而且还支持IP编辑、视角切换、风格迁移等生成式玩法。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


网友:这一连串功能摆出来,PS都得收声。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


一次出图,玩转增删改


话不多说,我们直接看效果。


原创IP编辑


原创IP编辑需要保持原始图像视觉语义不变的前提下,对图像内容进行修改,也就是所谓的语义编辑。


Qwen以他们的吉祥物卡皮巴拉作为输入,生成了一系列衍生IP形象。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


(卡皮巴拉:我一好好的水豚成熊了?)


不难看出,这些IP形象既忠实呈现了卡皮巴拉的角色特性,又在对应场景中展现出丰富多彩的形象。


那么,Demo很优秀,实测效果又如何?


对此,我们进行了简单地实测,提示词:这只熊穿着体操队服,双手拉在单杠上。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


实话说,生成效果确实不赖,单杠因受力产生了自然变形,更难能可贵的是双手手指数量也是一致的(动漫角色经典的四根手指)。


视角转换


接下来是视角转换,Qwen-Image-Edit在这里不仅展示了90度旋转,还展示了180度旋转。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


我们把WRC上拍的小瓦力输入Qwen-Image-Edit,分别进行右侧,后侧视角转换的测试。


(注:这张图片并不是严格意义上的主视图,而且还有点俯视,我们看看效果。)


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


严格来说,右侧瓦利的右手(图片左)有些变形,但转向后侧的效果实属惊艳到了。


虚拟形象生成


虚拟形象可以说是大伙最爱玩的功能之一,生成头像嘎嘎好用。


在Qwen展示的案例中,如果硬要挑刺就是——3D卡通风格把原先的半框眼镜变成了全框的黑框眼镜。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”

在测试的过程中,我们发现,一旦画风变得复杂(图为热血漫画风格),线条就会稍显凌乱。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


(眼镜框细节倒是保留了下来)


不过,在网友的测试中,效果倒是非常不错:自拍头像的女性版本,动漫版,007版和恶魔版本。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”

A新增


除了上面的生成式语义编辑,外观元素的增、删、改也非常重要。


Qwen-Image-Edit展示了在图片中添加指示牌的案例,可以看到Qwen-Image-Edit不仅成功添加了指示牌,还生成了相应的倒影,细节处理十分到位。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”

我们用一张在颐和园实拍的照片进行测试,提示词:add the small wooden sign in the foreground in front of the tree with the text ‘welcome to SummerPalace’(在树前的前景中添加一个小木牌,牌上写着“欢迎来到颐和园”。)


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


在测试中,我们发现,如果输入的图像分辨率过高,Qwen会主动报告:编辑后的图片会降低分辨率。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


同时,由于照片的分辨率较高,生成的图片有些失真。


不过,基本的画面元素和新增操作还是实现了。


为了验证是否是分辨率的问题,我们把照片换成分辨率没那么高的漫画图片,输出效果还是非常不错的。


提示词:add the small wooden sign in the foreground in front of the woman with the text ‘welcome to the sea’(在女人前的前景中添加一个小木牌,牌上写着“欢迎来到大海”。)


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


AI消除与重绘


在消除和重绘方面,Qwen展示了两个很巧妙的例子,一个是去除头发丝等细小元素,另一个是在一堆复杂元素中,选取其中一个元素改变颜色。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”

看得出来,效果确实不错。


这里我们简单测试了一下改颜色的操作,把上面的a从黄色变成橙色。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


其他字母的颜色都没变,只有a变了。


我服了!确实厉害!


虚拟场景与穿搭模拟


接下来是两个老生常谈的电商场景,模特换背景,换衣服。


人物手部,肢体末端,头发,光影表现都不错。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


文字设计与海报编辑


Qwen-Image-Edit在下面的案例中展示了中、英双语的文字编辑能力。


令人惊艳的是,其不光能修改海报中的大字,连细小的文字也能精准调整。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”

对此,我们拿自己的海报进行了测试:把AICoding改成AIAgent。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


没毛病,高,实在是高!


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


链式编辑


最后,就是我们开头展示的,框出错误的部分,逐步修改的方法,Qwen-Image-Edit把它叫做链式编辑。


在Qwen展示的案例中,他们先用Qwen-Image生成了一幅《兰亭集序》。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


不难看出,这幅AI生成的书法作品中有不少错字。


在这里,Qwen展示了不用重新生成整幅图片,就能解决这些问题的办法——


很简单,就是框住错误的字,交给Qwen-Image-Edit改就可以。


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


离谱的是,对于一些生僻字,还可以圈出错误的偏旁,实现偏旁级别的修复。


就这样,逐步修改画面中的瑕疵,最终得到完美的图片。


需要说明的是,上述简单实测均为一次出图


可以看到,经过Qwen-Image-Edit处理的图片,虽然有时会有一些色调,细节的轻微改变,但在绝大多数情况下,都和官方说的一样,能达到不错的编辑效果。


你给这个效果打几分?


凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”


创意+精准,统统搞定


据介绍,Qwen-Image-Edit这次的主要更新包括:


  • 语义与外观双重编辑:Qwen-Image-Edit不仅支持low-level的视觉外观编辑(如元素的添加、删除、修改等,要求图片其他区域完全不变),也支持high-level的视觉语义编辑(如IP创作、物体旋转、风格迁移等,允许整体像素变化但保持语义一致)。
  • 精准文字编辑:Qwen-Image-Edit支持中英文双语文字编辑,可在保留原有字体、字号、风格的前提下,直接对图片中的文字进行增、删、改等操作。
  • 强大的基准性能:在多个公开基准测试中的评估表明,Qwen-Image-Edit在图像编辑任务上具备SOTA性能,是一个强大的图像编辑基础模型。


其中,为了同时实现语义与外观双重的编辑能力,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL(实现视觉语义控制)和VAEEncoder(实现视觉外观控制)。


换句话说,就是从创意裂变到精准改字,所有常见的图像编辑需求Qwen都能hold住。


最后,Qwen-Image-Edit的体验方式如下,感兴趣的同学快去体验吧!


Qwen-Image-Edit:https://huggingface.co/spaces/Qwen/Qwen-Image-Edit


Qwenchat:https://chat.qwen.ai/


GitHub:https://github.com/QwenLM/Qwen-Image



文章来自微信公众号 “ 量子位 ”,作者 henry 

关键词: AI新闻 , Qwen-Image-Edit , AI PS , Qwen
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0