凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

9171点击 2025-08-19 21:32

用提示词就能点对点编辑图片？

Qwen：没错，正是在下。

瞧，上面这套“哪里不对改哪里”的操作，就来自“凌晨战神”Qwen团队最新发布的——Qwen-Image-Edit。

作为Qwen-Image20B的图像编辑版，Qwen-Image-Edit除了能做上面这种精准的文字修改，还能够新增、消除、重绘、修改元素，而且还支持IP编辑、视角切换、风格迁移等生成式玩法。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

网友：这一连串功能摆出来，PS都得收声。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

一次出图，玩转增删改

话不多说，我们直接看效果。

原创IP编辑

原创IP编辑需要保持原始图像视觉语义不变的前提下，对图像内容进行修改，也就是所谓的语义编辑。

Qwen以他们的吉祥物卡皮巴拉作为输入，生成了一系列衍生IP形象。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

（卡皮巴拉：我一好好的水豚成熊了？）

不难看出，这些IP形象既忠实呈现了卡皮巴拉的角色特性，又在对应场景中展现出丰富多彩的形象。

那么，Demo很优秀，实测效果又如何？

对此，我们进行了简单地实测，提示词：这只熊穿着体操队服，双手拉在单杠上。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

实话说，生成效果确实不赖，单杠因受力产生了自然变形，更难能可贵的是双手手指数量也是一致的（动漫角色经典的四根手指）。

视角转换

接下来是视角转换，Qwen-Image-Edit在这里不仅展示了90度旋转，还展示了180度旋转。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

我们把WRC上拍的小瓦力输入Qwen-Image-Edit，分别进行右侧，后侧视角转换的测试。

（注：这张图片并不是严格意义上的主视图，而且还有点俯视，我们看看效果。）

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

严格来说，右侧瓦利的右手（图片左）有些变形，但转向后侧的效果实属惊艳到了。

虚拟形象生成

虚拟形象可以说是大伙最爱玩的功能之一，生成头像嘎嘎好用。

在Qwen展示的案例中，如果硬要挑刺就是——3D卡通风格把原先的半框眼镜变成了全框的黑框眼镜。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

在测试的过程中，我们发现，一旦画风变得复杂（图为热血漫画风格），线条就会稍显凌乱。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

（眼镜框细节倒是保留了下来）

不过，在网友的测试中，效果倒是非常不错：自拍头像的女性版本，动漫版，007版和恶魔版本。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

A新增

除了上面的生成式语义编辑，外观元素的增、删、改也非常重要。

Qwen-Image-Edit展示了在图片中添加指示牌的案例，可以看到Qwen-Image-Edit不仅成功添加了指示牌，还生成了相应的倒影，细节处理十分到位。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

我们用一张在颐和园实拍的照片进行测试，提示词：add the small wooden sign in the foreground in front of the tree with the text ‘welcome to SummerPalace’（在树前的前景中添加一个小木牌，牌上写着“欢迎来到颐和园”。）

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

在测试中，我们发现，如果输入的图像分辨率过高，Qwen会主动报告：编辑后的图片会降低分辨率。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

同时，由于照片的分辨率较高，生成的图片有些失真。

不过，基本的画面元素和新增操作还是实现了。

为了验证是否是分辨率的问题，我们把照片换成分辨率没那么高的漫画图片，输出效果还是非常不错的。

提示词：add the small wooden sign in the foreground in front of the woman with the text ‘welcome to the sea’（在女人前的前景中添加一个小木牌，牌上写着“欢迎来到大海”。）

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

AI消除与重绘

在消除和重绘方面，Qwen展示了两个很巧妙的例子，一个是去除头发丝等细小元素，另一个是在一堆复杂元素中，选取其中一个元素改变颜色。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

看得出来，效果确实不错。

这里我们简单测试了一下改颜色的操作，把上面的a从黄色变成橙色。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

其他字母的颜色都没变，只有a变了。

我服了！确实厉害！

虚拟场景与穿搭模拟

接下来是两个老生常谈的电商场景，模特换背景，换衣服。

人物手部，肢体末端，头发，光影表现都不错。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

文字设计与海报编辑

Qwen-Image-Edit在下面的案例中展示了中、英双语的文字编辑能力。

令人惊艳的是，其不光能修改海报中的大字，连细小的文字也能精准调整。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

对此，我们拿自己的海报进行了测试：把AICoding改成AIAgent。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

没毛病，高，实在是高！

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

链式编辑

最后，就是我们开头展示的，框出错误的部分，逐步修改的方法，Qwen-Image-Edit把它叫做链式编辑。

在Qwen展示的案例中，他们先用Qwen-Image生成了一幅《兰亭集序》。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

不难看出，这幅AI生成的书法作品中有不少错字。

在这里，Qwen展示了不用重新生成整幅图片，就能解决这些问题的办法——

很简单，就是框住错误的字，交给Qwen-Image-Edit改就可以。

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

离谱的是，对于一些生僻字，还可以圈出错误的偏旁，实现偏旁级别的修复。

就这样，逐步修改画面中的瑕疵，最终得到完美的图片。

需要说明的是，上述简单实测均为一次出图。

可以看到，经过Qwen-Image-Edit处理的图片，虽然有时会有一些色调，细节的轻微改变，但在绝大多数情况下，都和官方说的一样，能达到不错的编辑效果。

你给这个效果打几分？

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

创意+精准，统统搞定

据介绍，Qwen-Image-Edit这次的主要更新包括：

语义与外观双重编辑：Qwen-Image-Edit不仅支持low-level的视觉外观编辑（如元素的添加、删除、修改等，要求图片其他区域完全不变），也支持high-level的视觉语义编辑（如IP创作、物体旋转、风格迁移等，允许整体像素变化但保持语义一致）。
精准文字编辑：Qwen-Image-Edit支持中英文双语文字编辑，可在保留原有字体、字号、风格的前提下，直接对图片中的文字进行增、删、改等操作。
强大的基准性能：在多个公开基准测试中的评估表明，Qwen-Image-Edit在图像编辑任务上具备SOTA性能，是一个强大的图像编辑基础模型。

其中，为了同时实现语义与外观双重的编辑能力，Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL（实现视觉语义控制）和VAEEncoder（实现视觉外观控制）。

换句话说，就是从创意裂变到精准改字，所有常见的图像编辑需求Qwen都能hold住。

最后，Qwen-Image-Edit的体验方式如下，感兴趣的同学快去体验吧！

Qwen-Image-Edit：https://huggingface.co/spaces/Qwen/Qwen-Image-Edit

Qwenchat：https://chat.qwen.ai/

GitHub:https://github.com/QwenLM/Qwen-Image

文章来自微信公众号 “ 量子位 ”，作者 henry

关键词: AI新闻 , Qwen-Image-Edit , AI PS , Qwen

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用，可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址：https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用：https://aicomicfactory.app/

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0