AI资讯新闻榜单内容搜索-diffusion

语言图像模型大一统！Meta将Transformer和Diffusion融合，多模态AI王者登场

就在刚刚，Meta最新发布的Transfusion，能够训练生成文本和图像的统一模型了！完美融合Transformer和扩散领域之后，语言模型和图像大一统，又近了一步。也就是说，真正的多模态AI模型，可能很快就要来了！

来自主题: AI技术研报

10974 点击 2024-08-24 16:04

大家还记得 Stable Diffusion嘛，就是那个曾经和 DALL·E 、 Midjourney 齐名的图像生成 AI 。

来自主题: AI资讯

4429 点击 2024-08-14 11:03

近日，来自加州大学尔湾分校等机构的研究人员，利用延迟掩蔽、MoE、分层扩展等策略，将扩散模型的训练成本降到了1890美元。

来自主题: AI资讯

8529 点击 2024-08-12 17:11

也许视觉模型离AGI更近。

来自主题: AI资讯

9360 点击 2024-08-08 10:01

最强开源文生图模型一夜易主！智东西8月2日报道，昨日晚间，开源文生图模型霸主Stable Diffusion原班人马，宣布推出全新的图像生成模型FLUX.1。

来自主题: AI技术研报

7464 点击 2024-08-05 12:06

AI 图像和视频生成领域又加入了一个颇有实力的玩家。

来自主题: AI资讯

10921 点击 2024-08-02 14:35

2024 年的 AI 图像生成技术，又提升到了一个新高度。

来自主题: AI资讯

11662 点击 2024-07-29 20:26

近日，MIT CSAIL 的一个研究团队（一作为 MIT 在读博士陈博远）成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起，提出了一种训练和采样范式：Diffusion Forcing（DF）。

来自主题: AI技术研报

5207 点击 2024-07-23 16:40

2022年，美图CEO吴欣鸿将年度总结的主题，从“居安思危”改成了“居危思危”。

来自主题: AI资讯

10482 点击 2024-07-13 12:51

荷兰拉德布德大学的研究团队通过定位大脑注意力机制，在AI「读心术」领域精确生成图像，能够依据大脑活动记录极为准确地重建猕猴所看到的内容。网友：这是人机融合的最终目标。

来自主题: AI技术研报

9834 点击 2024-07-05 16:27