AI资讯新闻榜单内容搜索-生图模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 生图模型
何恺明团队发布像素空间文生图模型MiniT2I

何恺明团队发布像素空间文生图模型MiniT2I

何恺明团队发布像素空间文生图模型MiniT2I

文本生成图像的领域早已经是一片红海,看上去已经卷无可卷了。

来自主题: AI技术研报
8823 点击    2026-06-22 16:53
沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

来自西湖大学和香港中文大学(深圳)的团队沿着这一思路提出 Drifting Preference Optimization(DrPO),把漂移场用于单步文生图模型的偏好后训练。在 DrPO 中,奖励只负责对候选图像排序,不参与反向传播。具体而言,针对同一个文本提示词,当前模型生成一组候选图像。高分样本在特征空间中产生吸引,低分样本产生排斥,并结合参考模型约束给出模型的更新方向。

来自主题: AI技术研报
7621 点击    2026-06-21 10:33
ICML 2026|文生图模型也会「忘词」?复旦创智等提出Prompt Reinjection,无需训练提升文生图指令遵循能力

ICML 2026|文生图模型也会「忘词」?复旦创智等提出Prompt Reinjection,无需训练提升文生图指令遵循能力

ICML 2026|文生图模型也会「忘词」?复旦创智等提出Prompt Reinjection,无需训练提升文生图指令遵循能力

近年来,文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image,扩散模型已经能够生成高质量图像,也能处理越来越复杂的文本提示。

来自主题: AI技术研报
9574 点击    2026-06-09 10:02
阿里开源PromptEcho:用冻结多模态大模型为文生图训练提供高质量Reward

阿里开源PromptEcho:用冻结多模态大模型为文生图训练提供高质量Reward

阿里开源PromptEcho:用冻结多模态大模型为文生图训练提供高质量Reward

用强化学习(RL)优化文生图模型的 prompt following 能力,是一条被广泛验证的路径 —— 让模型根据 prompt 用不同随机种子生成多张图片,通过 reward model 计算 reward,再利用相关 RL 算法优化模型。

来自主题: AI技术研报
7440 点击    2026-05-06 14:27
实测ChatGPT最新生图模型三大发现

实测ChatGPT最新生图模型三大发现

实测ChatGPT最新生图模型三大发现

AI第一次从包工头,变成了建筑设计师。

来自主题: AI产品测评
7514 点击    2026-04-24 10:09
比Nano Banana还夯的生图模型泄露,截图不再是证据了 | 附提示词

比Nano Banana还夯的生图模型泄露,截图不再是证据了 | 附提示词

比Nano Banana还夯的生图模型泄露,截图不再是证据了 | 附提示词

4 月初,LM Arena 评测平台上出现了三个匿名图像模型,代号分别是 maskingtape-alpha、packingtape-alpha、gaffertape-alpha。几小时后它们消失了。OpenAI 官方还没有正式宣布这个模型,但根据 API 返回的元数据和用户侧的测试记录,它已经有了一个被广泛接受的名字:GPT Image 2。

来自主题: AI资讯
8652 点击    2026-04-19 13:39
这是一个划时代的生图模型,一手实测Wan2.7-Image

这是一个划时代的生图模型,一手实测Wan2.7-Image

这是一个划时代的生图模型,一手实测Wan2.7-Image

3月30日,阿里巴巴内部发布了 Wan2.7-Image 图像生成与编辑统一模型。根据官方公布的数据,在人类偏好盲测评分中,Wan2.7-Image 目前位列国内第一。从放出的评测雷达图来看,无论是文本生图(Text-to-Image)还是综合图像编辑(Image Editing),它的各项指标基本都盖过了市面上主流的几家头部模型。

来自主题: AI资讯
9276 点击    2026-04-02 10:42
谷歌深夜突发Nano Banana 2,生图圈天塌了!Pro级4K大片,价格砍半

谷歌深夜突发Nano Banana 2,生图圈天塌了!Pro级4K大片,价格砍半

谷歌深夜突发Nano Banana 2,生图圈天塌了!Pro级4K大片,价格砍半

一周一更,谷歌又在深夜扔出「深水炸弹」。就在刚刚,最强生图模型Nano Banana 2横空出世,背靠全新Gemini 3.1 Flash Image。 它不仅生成速度飞快,多语言文字处理更强,还能实时联网,一次直出4K大片。

来自主题: AI资讯
9989 点击    2026-02-27 10:07
AI 生图模型的「刻板印象」已经到达了一个很抽象的地步

AI 生图模型的「刻板印象」已经到达了一个很抽象的地步

AI 生图模型的「刻板印象」已经到达了一个很抽象的地步

马上春节假期都结束了,不知道大家有没有人被家里催婚 😭 我这几天一直躺在屋里,为了躲避惨无人道的亲戚催婚,睡得昏天暗地,睡觉、刷抖音、刷 X、刷小红书、吃饭、睡觉,闭环了。 就在昨天,我日常刷抖音的时

来自主题: AI资讯
9543 点击    2026-02-23 19:18
LeCun、谢赛宁团队重磅论文:RAE能大规模文生图了,且比VAE更好

LeCun、谢赛宁团队重磅论文:RAE能大规模文生图了,且比VAE更好

LeCun、谢赛宁团队重磅论文:RAE能大规模文生图了,且比VAE更好

编辑|Panda 在文生图模型的技术版图中,VAE 几乎已经成为共识。从 Stable Diffusion 到 FLUX,再到一系列扩散 Transformer,主流路线高度一致:先用 VAE 压缩视

来自主题: AI技术研报
7988 点击    2026-01-24 10:52