AI资讯新闻榜单内容搜索-图像生成

Qwen新开源，把AI生图里的文字SOTA拉爆了

通义模型家族，刚刚又双叒开源了，这次是Qwen-Image——一个200亿参数、采用MMDiT架构的图像生成模型。这也是通义千问系列中首个图像生成基础模型。

来自主题: AI技术研报

8680 点击 2025-08-05 17:10

训练时间减半，性能不降反升！腾讯混元开源图像生成高效强化方案MixGRPO

图像生成不光要好看，更要高效。混元基础模型团队提出全新框架MixGRPO，该框架通过结合随机微分方程（SDE）和常微分方程（ODE），利用混合采样策略的灵活性，简化了MDP中的优化流程，从而提升了效率的同时还增强了性能。

来自主题: AI技术研报

8649 点击 2025-08-03 13:37

自回归模型杀回图像生成！实现像素级精准控制，比Diffusion更高效可控

当下的AI图像生成领域，Diffusion模型无疑是绝对的王者，但在精准控制上却常常“心有余而力不足”。

来自主题: AI技术研报

10851 点击 2025-07-30 10:55

AMD携手Stability AI推出世界首款适用于Stable Diffusion 3.0 Medium的B16 NPU模型，带来更快速且画质无损的文生图功能

AMD携手Stability AI宣布推出世界首款适用于Stable Diffusion 3.0 Medium的B16 NPU模型。该模型可直接运行于AMD XDNA 2 NPU之上，能够显著提升图像生成质量。新模型作为Amuse 3.1平台的组件之一亮相，于今天一起发布。

来自主题: AI资讯

11293 点击 2025-07-23 10:06

ICCV 2025｜训练太复杂？对图片语义、布局要求太高？图像morphing终于一步到位

本文第一作者操雨康，南洋理工大学MMLab博士后，研究方向是3D/4D重建与生成，人体动作/视频生成，以及图像生成与编辑。

来自主题: AI技术研报

9520 点击 2025-07-18 11:12

ACL 2025 Oral | 你的模型评测搭子上线：Evaluation Agent懂你更懂AI

怎么快速判断一个生成模型好不好？最直接的办法当然是 —— 去问一位做图像生成、视频生成、或者专门做评测的朋友。他们懂技术、有经验、眼光毒辣，能告诉你模型到底强在哪、弱在哪，适不适合你的需求。

来自主题: AI技术研报

7989 点击 2025-07-18 11:02

ICML 2025｜多模态理解与生成最新进展：港科联合SnapResearch发布ThinkDiff，为扩散模型装上大脑

自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来，文本到图像的生成技术取得了长足进步。但它们往往只能根据精确的文字或图片提示作图，缺乏真正读懂图像与文本、在多模态上下文中推理并创作的能力。能否让模型像人类一样真正读懂图像与文本、完成多模态推理与创作，一直是学术界和工业界关注的热门问题。

来自主题: AI技术研报

9377 点击 2025-07-16 15:19