AI资讯新闻榜单内容搜索-文生图模型

何恺明团队发布像素空间文生图模型MiniT2I

文本生成图像的领域早已经是一片红海，看上去已经卷无可卷了。

来自主题: AI技术研报

8822 点击 2026-06-22 16:53

沿着何恺明团队「漂移模型」再走一步：奖励只需排名，单步文生图偏好优化提速3.51倍

来自西湖大学和香港中文大学（深圳）的团队沿着这一思路提出 Drifting Preference Optimization（DrPO），把漂移场用于单步文生图模型的偏好后训练。在 DrPO 中，奖励只负责对候选图像排序，不参与反向传播。具体而言，针对同一个文本提示词，当前模型生成一组候选图像。高分样本在特征空间中产生吸引，低分样本产生排斥，并结合参考模型约束给出模型的更新方向。

来自主题: AI技术研报

7621 点击 2026-06-21 10:33

ICML 2026｜文生图模型也会「忘词」？复旦创智等提出Prompt Reinjection，无需训练提升文生图指令遵循能力

近年来，文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image，扩散模型已经能够生成高质量图像，也能处理越来越复杂的文本提示。

来自主题: AI技术研报

9573 点击 2026-06-09 10:02

阿里开源PromptEcho：用冻结多模态大模型为文生图训练提供高质量Reward

用强化学习（RL）优化文生图模型的 prompt following 能力，是一条被广泛验证的路径 —— 让模型根据 prompt 用不同随机种子生成多张图片，通过 reward model 计算 reward，再利用相关 RL 算法优化模型。

来自主题: AI技术研报

7440 点击 2026-05-06 14:27

LeCun、谢赛宁团队重磅论文：RAE能大规模文生图了，且比VAE更好

编辑｜Panda 在文生图模型的技术版图中，VAE 几乎已经成为共识。从 Stable Diffusion 到 FLUX，再到一系列扩散 Transformer，主流路线高度一致：先用 VAE 压缩视

来自主题: AI技术研报

7987 点击 2026-01-24 10:52

6B文生图模型，上线即登顶抱抱脸

6B小模型，首日下载量高达50万次，上线不到两天直接把HuggingFace两个榜单都冲了个第一。

来自主题: AI技术研报

7904 点击 2025-12-01 15:13

Nano Banana Pro上线！集成Gemini 3与Veo 3，谷歌不给竞争对手喘息机会

谷歌乘胜追击！Gemini 3 Pro好评如潮没两天，最强文生图模型Nano Banana也推出Pro版本。

来自主题: AI资讯

8656 点击 2025-11-21 10:54

Nano-Banana 核心团队首次揭秘，全球最火的 AI 生图工具是怎么打造的

在图像生成上，Google 其实已经有 Imagen 4 这样的文生图模型，为什么 nano banana 最后还是由 Google 带来的？但这确实不是偶然或者瞎猜的，nano banana 是结合了 Google 多个团队的项目成果。首先就是 Gemini 强大的世界知识与指令遵循能力，其次就是 Google 内部顶尖文生图模型 Imagen，所提供的极致图像美学与自然度追求。

来自主题: AI技术研报

11910 点击 2025-09-02 09:24

从捍卫者到引路人，上交&上海AI Lab提出LEGION：不仅是AI图像伪造克星，还能反哺生成模型进化？

近年来，文生图模型（Text-to-Image Models）飞速发展，从早期的 GAN 架构到如今的扩散和自回归模型，生成图像的质量和细节表现力实现了跨越式提升。这些模型大大降低了高质量图像创作的门槛，为设计、教育、艺术创作等领域带来了前所未有的便利。

来自主题: AI技术研报

8823 点击 2025-08-12 11:31

谷歌 Imagen 4 / Ultra 上线 AI Studio！将集成 Jules 和 MCP，我用它切了个黑洞。

谷歌把最新的文生图模型 Imagen 4，以及它的 Pro Max 版 Imagen 4 Ultra，放到了 AI Studio 和 API 里。

来自主题: AI资讯

9143 点击 2025-06-26 11:21