AI资讯新闻榜单内容搜索-Image

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Image
何恺明重磅新作:Just image Transformers让去噪模型回归基本功

何恺明重磅新作:Just image Transformers让去噪模型回归基本功

何恺明重磅新作:Just image Transformers让去噪模型回归基本功

大家都知道,图像生成和去噪扩散模型是密不可分的。高质量的图像生成都通过扩散模型实现。

来自主题: AI技术研报
6605 点击    2025-11-19 16:42
用AI帮用户自信开口,AI教育产品Voice Image ARR破千万美元

用AI帮用户自信开口,AI教育产品Voice Image ARR破千万美元

用AI帮用户自信开口,AI教育产品Voice Image ARR破千万美元

「Voice Image」创始人 Nick Lahoika 出生在白俄罗斯,后来移民到爱沙尼亚才开始学习英语,跨语言的生活环境让他在很长一段时间内都对表达缺乏自信,直到遇到了一位专业声音教练。他才意识到表达是可以训练的,这也成为其创业的起点。

来自主题: AI资讯
7865 点击    2025-11-17 22:38
英国首例AI训练判决!Stability AI大战Getty Images,双方均宣称胜诉

英国首例AI训练判决!Stability AI大战Getty Images,双方均宣称胜诉

英国首例AI训练判决!Stability AI大战Getty Images,双方均宣称胜诉

2025年11月4日,一家总部位于英国伦敦的人工智能公司Stability AI,赢得了一项具有里程碑意义的高等法院案件,该案审查了人工智能模型在未经许可的情况下使用大量受版权保护数据的合法性。而本案的原告,Getty Images 在针对人工智能公司 Stability AI 图像生成产品的英国诉讼中基本败诉。

来自主题: AI监管政策
8376 点击    2025-11-06 11:38
NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

当下的文本生成图像扩散模型取得了长足进展,为图像生成引入布局控制(Layout-to-Image, L2I)成为可能。

来自主题: AI技术研报
6125 点击    2025-11-04 11:33
3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

今天推荐一个 Dense Image Captioning 的最新技术 —— CapRL (Captioning Reinforcement Learning)。CapRL 首次成功将 DeepSeek-R1 的强化学习方法应用到 image captioning 这种开放视觉任务,创新的以实用性重新定义 image captioning 的 reward。

来自主题: AI技术研报
9603 点击    2025-10-29 10:24
打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集

打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集

打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集

在开放研究领域里,苹果似乎一整个脱胎换骨,在纯粹的研究中经常会有一些出彩的工作。这次苹果发布的研究成果的确出人意料:他们用谷歌的 Nano-banana 模型做个了视觉编辑领域的 ImageNet。

来自主题: AI技术研报
9667 点击    2025-10-27 11:13
Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

在 AIGC 的下一个阶段,图像编辑(Image Editing)正逐渐取代一次性生成,成为检验多模态模型理解、生成与推理能力的关键场景。我们该如何科学、公正地评测这些图像编辑模型?

来自主题: AI技术研报
6807 点击    2025-10-25 14:26
智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

随着多模态大模型的不断演进,指令引导的图像编辑(Instruction-guided Image Editing)技术取得了显著进展。然而,现有模型在遵循复杂、精细的文本指令方面仍面临巨大挑战,往往需要用户进行多次尝试和手动筛选,难以实现稳定、高质量的「一步到位」式编辑。

来自主题: AI技术研报
9865 点击    2025-10-23 12:28
谷歌、字节神仙打架,为何这款叫 Reve 的工具却在悄悄刷屏?

谷歌、字节神仙打架,为何这款叫 Reve 的工具却在悄悄刷屏?

谷歌、字节神仙打架,为何这款叫 Reve 的工具却在悄悄刷屏?

Reve AI 是一家 2023 年 12 月才建立的加州 AI 初创公司,他们在 2025 年 3 月推出了第一个生图模型叫 Reve Image 1.0,内部代号是「Halfmoon」。6 个月过后,再次升级该模型为「图像编辑模型」。

来自主题: AI资讯
10064 点击    2025-10-17 08:39