AI资讯新闻榜单内容搜索-ima

扩散模型里的噪声，原来还有这样的作用：DRDD重新定义统一图像翻译

在图像到图像翻译（Image-to-Image Translation, I2I）这个任务上，扩散模型过去几年几乎形成了一套默认逻辑：先把输入图像和噪声混合，再一步步去噪，把目标图像 “还原” 出来。

来自主题: AI技术研报

9946 点击 2026-06-10 15:15

ICML 2026｜文生图模型也会「忘词」？复旦创智等提出Prompt Reinjection，无需训练提升文生图指令遵循能力

近年来，文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image，扩散模型已经能够生成高质量图像，也能处理越来越复杂的文本提示。

来自主题: AI技术研报

9572 点击 2026-06-09 10:02

对话 MiniMax 择因：Agent 终会超过人类，我们又将何去何从？

Agent 的世界，四月还是山雨欲来。五月尚未结束，已然血雨腥风。

来自主题: AI资讯

9518 点击 2026-06-08 14:51

一步生成 ImageNet FID 1.29！斯坦福用 Wasserstein 梯度流重写一步生成模型

训练时让分布沿最优传输的 “下山方向” 走，推理时只需一次网络前向。W-Flow 把多步演化压进静态生成器，在 ImageNet 256×256 上刷新一步生成指标。

来自主题: AI技术研报

9547 点击 2026-06-03 14:34

文生图开源第一易主，但 HiDream-O1-Image 为什么褒贬不一？

UiT 架构探路者，底牌还没亮。

来自主题: AI资讯

10489 点击 2026-06-02 15:05

MiniMax 低调发布 M3 和 MiniMax Code，我们测完后有几点感受

前沿的 Coding 能力、1M 的上下文窗口，还有原生的多模态

来自主题: AI产品测评

8175 点击 2026-06-02 11:58

AI实验室Agnes AI开放全模态不限时免费API！重点是免费！

在这场日益蔓延的“Token焦虑”中，Agnes AI的举动显得格外扎眼——这家全球榜单排名第九的AI Lab宣布，自6月1日起，旗下全模态模型API无限期免费开放。Agnes AI本次开放覆盖其三款核心模型：文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.0-Flash以及视频模型Agnes-Video-V2.0。

来自主题: AI资讯

12989 点击 2026-06-01 11:24

MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你

MiniMax M3 今日正式发布。MiniMax M3 在编程和智能体等专业任务上达到了前沿的能力。它使用了我们提出的全新注意力架构 MSA （MiniMax Sparse Attention），最高支持 1M 超长上下文。如外界所期待的那样，它也是一个原生多模态模型，支持图片和视频的输入，并能操作电脑桌面。

来自主题: AI资讯

9921 点击 2026-06-01 09:49

从Token无上限到全员Agent：MiniMax的AI Native组织进化实践丨MiniMax胡维琦 @AIGC2026

本次2026中国AIGC产业峰会上，MiniMax ToB中国区商业化负责人胡维琦，分享了自己在AI创业公司中的实践与思考。与其焦虑AI，不如加入AI。大家不用看营销号，更多的还是自己动手试试。

来自主题: AI资讯

8611 点击 2026-05-31 11:21

李飞飞造了ImageNet，现在她又带人超越了它

就在前两天，斯坦福大学等机构发布了一个名为 GPIC（Giant Permissive Image Corpus，巨型开放图像语料库）的数据集。

来自主题: AI技术研报

9192 点击 2026-05-30 15:57