AI资讯新闻榜单内容搜索-图像生成

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 图像生成

画到哪，动到哪！字节跳动发布视频生成「神笔马良」ATI，已开源！

画到哪，动到哪！字节跳动发布视频生成「神笔马良」ATI，已开源！

画到哪，动到哪！字节跳动发布视频生成「神笔马良」ATI，已开源！

近年来，随着扩散模型（Diffusion Models）、Transformer 架构与高性能视觉理解模型的蓬勃发展，视频生成任务取得了令人瞩目的进展。从静态图像生成视频的任务（Image-to-Video generation）尤其受到关注，其关键优势在于：能够以最小的信息输入生成具有丰富时间连续性与空间一致性的动态内容。

来自主题: AI技术研报

9265 点击 2025-07-03 10:07

ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO：扩散/自回归模型训练新范式，刷新图像生成SOTA

ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO：扩散/自回归模型训练新范式，刷新图像生成SOTA

ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO：扩散/自回归模型训练新范式，刷新图像生成SOTA

清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化（DDO）。

来自主题: AI技术研报

8810 点击 2025-07-02 10:33

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

前段时间，沉寂了很久的Flux官方团队Black Forest Labs发布了新模型：FLUX.1 Kontext，这是一套支持生成与编辑图像的流匹配（flow matching）模型。FLUX.1 Kontext不仅支持文生图，还实现了上下文图像生成功能，可以同时使用文本和图像作为提示词，并能无缝提取修改视觉元素，生成全新且协调一致的画面。

来自主题: AI技术研报

10929 点击 2025-06-27 12:36

开源版MetaQuery来了！OpenUni用1.1B参数媲美BLIP3-o-8B，数据代码完全开源

开源版MetaQuery来了！OpenUni用1.1B参数媲美BLIP3-o-8B，数据代码完全开源

开源版MetaQuery来了！OpenUni用1.1B参数媲美BLIP3-o-8B，数据代码完全开源

随着 GPT-4o 展现出令人印象深刻的多模态能力，将视觉理解和图像生成统一到单一模型中已成为 AI 领域的研究趋势（如MetaQuery 和 BLIP3-o ）。

来自主题: AI技术研报

8514 点击 2025-06-22 16:39

Midjourney入局视频生成，图像模型V7不断更新，视觉卷王实锤了

Midjourney入局视频生成，图像模型V7不断更新，视觉卷王实锤了

Midjourney入局视频生成，图像模型V7不断更新，视觉卷王实锤了

图像生成界的“大魔王”Midjourney也来卷视频生成了？！

来自主题: AI资讯

10697 点击 2025-06-17 10:45

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？又该如何定义？

来自主题: AI技术研报

8976 点击 2025-06-10 16:18

AI疯狂进化6个月，一张天梯图全浓缩！30+模型混战，大神演讲爆火

AI疯狂进化6个月，一张天梯图全浓缩！30+模型混战，大神演讲爆火

AI疯狂进化6个月，一张天梯图全浓缩！30+模型混战，大神演讲爆火

在旧金山AI工程师世博会上，Simon Willison用自创「骑自行车的鹈鹕」图像生成测试，幽默回顾过去半年LLM的飞速发展。亲测30多款AI模型，强调工具+推理成最强AI组合！

来自主题: AI资讯

11617 点击 2025-06-09 15:23

生图效果媲美GPT-4o，一键搞定各类视觉生成任务丨港科广&字节全新框架

生图效果媲美GPT-4o，一键搞定各类视觉生成任务丨港科广&字节全新框架

生图效果媲美GPT-4o，一键搞定各类视觉生成任务丨港科广&字节全新框架

图像生成、视频创作、照片精修需要找不同的模型完成也太太太太太麻烦了。有没有这样一个“AI创作大师”，你只需要用一句话描述脑海中的灵感，它就能自动为你搭建流程、选择工具、反复修改，最终交付高质量的视觉作品呢？

来自主题: AI技术研报

9630 点击 2025-06-07 14:49

专治AI生图「人脸崩坏」，8倍速碾压GPT！新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」，8倍速碾压GPT！新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」，8倍速碾压GPT！新版FLUX.1多方位刷新SOTA

FLUX.1 Kontext是一款融合即时文本图像编辑与文本到图像生成的新一代模型，支持文本与图像提示，角色一致性强，速度快达GPT-Image-1的8倍。

来自主题: AI资讯

9810 点击 2025-05-31 14:26

字节把GPT-4o级图像生成能力开源了！

字节把GPT-4o级图像生成能力开源了！

字节把GPT-4o级图像生成能力开源了！

字节最近真的猛猛开源啊……这一次，他们直接开源了GPT-4o级别的图像生成能力。不止于此，其最新融合的多模态模型BAGEL主打一个“大一统”，将带图推理、图像编辑、3D生成等功能全都集中到了一个模型。

来自主题: AI技术研报

10806 点击 2025-05-24 17:34

上一页当前第8页,共20页下一页