谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上
5930点击    2025-09-16 09:58

谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌这只「香蕉」火得有些疯狂:Nano Banana(即 Gemini 2.5 Flash Image)自 8 月底上线以来,仅用几周就吸引了超过 1,000 万新用户,并在 Gemini 应用中完成了 2 亿次图像编辑请求


数据的飙升速度,几乎可以用「离谱」来形容。


就在大家还沉浸在谷歌新推出的 Nano Banana 引发的视觉狂潮中时,短短一周,字节跳动就在旗下各个平台推出了全新升级的 Seedream 4.0 ,紧追其后。


我们似乎能看到 2 个 AI 大厂的「隔海斗法」。


为了更直观地体验两款模型的差异,我特地跑去「巡查」自己订阅的各大会员平台,想找一个能同时用上 Nano Banana 和 Seedream 4.0 的地方。


结果发现,Lovart 动作最快,不仅第一时间同步上线了两款模型,还贴心地推出了一整套优惠活动(具体内容我们会在文末总结)。


接下来,就结合我们准备的一系列实测案例,带大家看看 Lovart 如何在一个平台里无缝串联这两款 SOTA 模型。


它们在风格特点、能力边界和适用场景上究竟有哪些不同。


黑客松海报艺术风格转换


Nano Banana 和 Seedream 4.0 虽然在图像编辑、生成能力上都非常出色,但在一些垂直场景中的呈现,还是能感受到微妙的差异。


比如我们先来看一个具体案例。


AI Hacker House 联合「十字路口」在 8 月 29 日发布了一张黑客松海报。整张海报元素非常复杂:既有 3D 感的线条,又有鲜艳的色彩和层叠的结构,但整体观感却非常协调,视觉冲击力也很强。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


看到这张图,我心里就冒出一个想法:能不能直接让 Lovart 的一站式生成能力,帮我把同一张海报转换成多种艺术风格?


这样就不用一张一张去「抽卡」,效率更高。


于是我尝试了一个非常简单的提示词:


将我上传的图片,转换艺术风格


也是我测试 Nano Banana 和 Seedream 4.0 的一个重点:它们是否能够在轻提示下就表现出足够的创造力和一致性。


先来看看 Nano Banana 的表现,Nano Banana 在执行时,几乎没有偏离我的原始设定。


它给出的结果往往忠于提示词,替换或转换的精度很高,风格的边界也很清晰。比如在处理色彩和轮廓时,它会保持整体结构的稳定性,生成的画面更像是「在原有设计上微调」,而不是彻底重塑。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


相比之下,Seedream 4.0 的结果更像是「在原图基础上进行艺术发散」。


它会尝试引入新的笔触质感、不同的色彩氛围,甚至局部构图上也会做一些微创新。最终的效果可能没有 Nano Banana 那么「精确」,但往往更具艺术感和惊喜感。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


整体来看,Nano Banana 更倾向于精准完成任务,而 Seedream 4.0 更像是在给结果「加点料」,带来额外的艺术张力。


如果你追求的是「尽量忠实于原图」的精确风格转换,Nano Banana 会更让人安心一点;但如果你希望结果中带点「意外的灵感」,Seedream 4.0 会显得「更香」。


一句话生成数十套时尚杂志封面


如果说黑客松海报测试更偏重于「复杂元素的整体艺术风格转换」,那么接下来的实验,就更贴近实际创作者的需求了:快速生成不同风格的时尚杂志封面。


这次我邀请了熟悉的「模特」:Koji 老师来担当主角。


下面这张图,就是我选定的主参考图:


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


为了让实验更贴近真实杂志,我随手在 Google 上截了几张图片:一部分是 Vogue 封面,另一部分则来自 芭莎男士


这些作为风格参考,非常适合拿来做替换测试。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


在 Lovart 中,我输入的提示词依旧非常简单,几乎就是一口气把需求讲清楚:


让图一的男士,替代图二(Vogue 或者 芭莎男士)中每一张小图,给我 XX 张图片


就是这样一句话,Lovart 就能帮我同时调用模型完成批量生成。


实际结果一出来,差异还是比较明显的。左侧为 Nano Banana,右侧为 Seedream4.0.


Nano Banana 在整体构图和风格替换上比较稳定,但在涉及到中文文字时,它会显得吃力一些。比如封面上常见的杂志标题、排版里的小字,有时会生成得模糊甚至错位。


Seedream 4.0 则在中文场景里更得心应手,封面上的汉字不但清晰,而且风格也很贴合。尤其是在版式较复杂的情况下,它几乎不用「抽卡」就能给出可直接使用的成品。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


Nano Banana


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


Seedream 4.0


下面是 Nano Banana 的表现,可以看到,整体风格感很到位,尤其是模特的脸部替换十分自然。在细节文字的保真度上,也很不错。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


接下来则是 Seedream 4.0 的表现。


在中文场景下,尤其是图片内部不涉及那么多字数的情况下,Seedream4.0 的表现可以说几乎不用抽卡。


整体来说,Seedream 4.0 在封面类任务中更像一个「排版助理」,对中文的兼容性非常好,不仅能处理大标题,就连小字的版式也能还原得很流畅。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


总结一下,如果你需要做国际风格的封面,且对中文排版要求不高,Nano Banana 已经能给到非常干净的替换效果。但如果你要直接做中文杂志的 Mockup(甚至可以直接商用),Seedream 4.0 基本可以实现「开箱即用」。


当然,如果出现太多文字的话,也仍然会出现一些幻觉,这时候则需要一些「抽卡」。


AI Hacker House Logo × 地标建筑融合


在时尚封面之外,我还想看看两个模型在多元素融合方面的表现。毕竟,现实创作者经常需要把 Logo、地标建筑、活动主题等元素揉合到一张图里,而不仅仅是单一风格的替换。


比如说,下个月「十字路口」团队计划在新加坡举办一场 AI 开放麦活动。


我找了两张参考图:一张是 AI Hacker House 的 Logo,另一张是我用 AI 生成的新加坡地标建筑元素图。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


然后,我试着将它们融合。同样提示词很简单,而且在 Lovart 上,你可以直接在一句话中,同时分别调用 2 个模型,就像我的提示词这样:

将 2 张参考图融合,Title 为 AI Hacker House X Singapore,英文用 Nano Banana,中文用 Seedream 4.0。


下面这些,就是我在第一轮 roll 出来的海报:


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


可以看到,两张参考图的要素都被很好地保留下来,Logo 和地标融合得比较自然。但因为我没有额外加上艺术风格要求,所以画面看起来略显「平淡」,更像是一份草图。


然后,我就开始进行了一系列「微操」。


接下来,我开始在同一上下文窗口里继续上传图片和追加提示。这里我感受到了 Lovart 的进化


【1】它能够清楚地分辨出提示词中不同部分的优先级。


【2】即使我没有切换上下文,它也能记住前文逻辑,把新图的风格应用到指定模型。


【3】它会轮换着用 Nano Banana 和 Seedream4.0 生图。


比如我上传了这张新图:


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


Lovart 仍然能够「聪明」地将这张图片的风格,经过思考和解析后,独立地分配给 Nano Banana 和 Seedream 4.0,它甚至能够调用 Nano Banana 生成一张图片,然后再用 Seedream 4.0 做一张图片。


2 个模型生成的结果如下。


先看看 Nano Banana 的表现:


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


Nano Banana 依旧保持了简洁、直接的风格。它会尽可能清晰地完成「融合」这件事,不做过多修饰。最终效果偏干净、规整、好看。


然后,则是 Seedream 4.0 的表现:


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


其实很明显,Nano Banana 更加「崇尚」简洁高效地完成任务,而 Seedream4.0 则会有意识地去运用更多复杂的元素。


Seedream 4.0 的结果则带有明显的艺术加工痕迹。它会主动加入光影、纹理或色彩渐变,让画面更具氛围感,海报感更强。


高定服装试穿


在海报和封面测试之后,我想尝试一个更贴近日常生活、也更能直观感受 AI 创意能力的场景:虚拟试衣间 + 化妆间


首先,我 AI 做了一张美女的视觉图,作为主要参考图:


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


然后,从网上随手找来一堆明星舞台高定服装:


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


随意输入提示词:


让图一的女士,试穿图二中每一张小图的明星高定服装,给我 9 张图片


结果出来后,9 张图有 5 张用 Nano Banana 生成,4 张用 Seedream 4.0 生成。两者的一致性都很高,整体观感非常自然,服装的褶皱、贴合度甚至光影效果,都很真实。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


这些图片当然看不出来 Nano Banana 和 Seedream 4.0 的区分度,但确实表明这 2 个模型的基础能力都相当不错。


虚拟妆容 + 手帐教程


进一步地,服装之后,我又把挑战升级到妆容上。我从网上随意找来了一张 16 种妆容的图片:


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


让 AI 模特依次尝试。下面这一组结果,第一排是 Seedream 4.0,第二排是 Nano Banana


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


辣妹妆


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


千金妆


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


华丽女主妆


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


韩式白开水妆


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


日系甜美妆


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


森系仙女妆


你能看得出来,在风格浓厚的妆容上 Seedream 4.0 表现的较为得心应手,而 Nano Banana 其实更适合淡妆(当然,我并不是内行,请各位女读者们在评论区评价下,2 个 AI 化妆器的表现究竟如何)


再进一步地,由于 2 个模型的视觉推理也都还不错,所以我还让 Lovart 进一步生成了 妆容教程手帐。这里我设定:英文由 Nano Banana 生成,中文由 Seedream 4.0 生成。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


这样就很明显了,在英文和中文 2 种语言里,这 2 个模型相比半年前的上一代 AI 图片生成模型,在文字输出上的幻觉表现,提升的非常大。


两个模型在图文结合的任务里,幻觉率已经大幅下降,无论是中文还是英文,都能把步骤和视觉图匹配得很流畅。


在体验了这么多案例之后,我本来以为积分肯定要消耗得差不多了。毕竟一路下来,几乎是“海量生成”,尤其是杂志封面和妆容测试,少说也得几十上百张图。


结果,当我从 Project 页面退出来时,却发现积分消耗竟然是 0。这让我一度怀疑是不是系统出 bug 了。


优惠活动


最后的最后,我玩了这么多案例,玩到头昏眼花,本以为积分所剩无几,然而从 Project 页面退出来后,才发现,积分消耗是 0 !


但查了一下才知道:原来 Lovart 近期在搞活动,尤其是这次我重点测的 Seedream 4.0 和 Nano Banana,从 9 月 10 日到 9 月 20 日 都是免费开放的。更惊喜的是,如果你在 20 号之前开通 Basic 及以上会员,那么在整个会员期间,这两个模型都可以 365 天无限量 0 积分使用


换句话说,如果你正好在这段时间开通会员,就相当于一年内随便玩,不用担心积分消耗的问题。对于喜欢做实验、批量生成的用户来说,这个优惠确实比较值。


更妙的是,我还顺手瞥了一眼其他模型:


【1】谷歌的 Veo 3 也在打折,居然是全系 3 折优惠


【2】可灵、海螺 在 9 月 20 日之前,Pro+ 会员都可以无限畅用。


所以我干脆马不停蹄,把这一路生成的图,利用 Lovart 的 ChatCanvas 功能,使用 Veo 3 帮 Koji 做了 2 个转场小视频,又拼合了起来。


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上


如果说前面几章是技术和艺术上的对比,那么最后这个福利,算是对所有创作者的「现实关怀」。因为创作本身就已经足够烧脑了,如果还能在成本上轻松一点,那就更容易让用户专注在作品上。


这一路下来,从黑客松海报到时尚杂志封面,从 Logo 与地标融合到虚拟试衣间和化妆教程,我基本把 Nano Banana 和 Seedream 4.0 两个模型在 Lovart 里的主要能力都体验了一遍。


最大的感受有三点:


【1】基础能力已经非常扎实


不论是 Nano Banana 还是 Seedream 4.0,在面对复杂提示、长上下文、多元素融合时,都展现出了远超半年前的稳定性和一致性。幻觉率明显下降,图文匹配也顺畅很多。


【2】风格倾向各有特点


Nano Banana 更像「执行型选手」:注重精确、简洁和一致性,尤其适合需要保持严谨结构的任务。


Seedream 4.0 更像「设计型选手」:在艺术发散、浓烈风格和中文排版上更有优势,生成结果往往带点小惊喜。


【3】Lovart 的体验感是加分项


不仅能一句话调用多模型,还能在长上下文里「记住」我的意图,甚至能自动帮我分配任务。用一句话形容就是:它不是在「执行指令」,而是在「理解设计」


更让人开心的是,这次体验几乎没花积分,还意外发现了不少活动优惠。


从这次测评来看,我能感觉到一个趋势:AI 图片生成已经逐渐从「实验室里的酷炫技术」,走向「普通人也能随手用」的生产力工具。


未来,它可能会进一步细分:一部分模型继续往高精度、低幻觉方向演进;另一部分则在艺术性、创造力上不断突破,像真正的合作者一样,和创作者共同完成作品。


Nano Banana 和 Seedream 4.0 就正好站在这两个方向的交叉点,各自延伸。


看完这次测评,你更喜欢哪种风格?欢迎在评论区聊聊,你的使用场景和体验感受!


谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上




文章来自于微信公众号 “十字路口Crossing”,作者 “十字路口Crossing”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0