AI资讯新闻榜单内容搜索-Image

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Image
AAAI 2026 Oral|LENS:基于统一强化推理的分割大模型

AAAI 2026 Oral|LENS:基于统一强化推理的分割大模型

AAAI 2026 Oral|LENS:基于统一强化推理的分割大模型

文本提示图像分割(Text-prompted image segmentation)是实现精细化视觉理解的关键技术,在人机交互、具身智能及机器人等前沿领域具有重大的战略意义。这项技术使机器能够根据自然语言指令,在复杂的视觉场景中定位并分割出任意目标。

来自主题: AI技术研报
9030 点击    2025-12-29 14:06
阿里开源图片分层新模型Qwen-lmage-Layered,PS危险了?

阿里开源图片分层新模型Qwen-lmage-Layered,PS危险了?

阿里开源图片分层新模型Qwen-lmage-Layered,PS危险了?

抽奖式的生图体验,确实让很多设计师在尝鲜之后又默默打开了 Photoshop。于是乎,阿里千问团队再次出手,开源了一个叫 Qwen-Image-Layered 的模型,试图从底层逻辑上解决这个问题。

来自主题: AI资讯
8966 点击    2025-12-23 17:08
ImageNet分数越高,生成反而越糊?iREPA给出解释

ImageNet分数越高,生成反而越糊?iREPA给出解释

ImageNet分数越高,生成反而越糊?iREPA给出解释

学霸的谎言被揭穿!一篇来自Adobe Research的论文发现,高语义理解并不会提升生成质量,反而可能破坏空间结构。用iREPA简单修改,削弱全局干扰,生成质量立即飙升 。

来自主题: AI技术研报
8866 点击    2025-12-23 10:05
让AI像人类画家一样边画边想,港中文&美团让模型「走一步看一步」

让AI像人类画家一样边画边想,港中文&美团让模型「走一步看一步」

让AI像人类画家一样边画边想,港中文&美团让模型「走一步看一步」

在文生图(Text-to-Image)和视频生成领域,以FLUX.1、Emu3为代表的扩散模型与自回归模型已经能生成极其逼真的画面。

来自主题: AI技术研报
10086 点击    2025-12-22 16:05
不靠死记布局也能按图生成,多实例生成的布局控制终于“可控且不串脸”了丨浙大团队

不靠死记布局也能按图生成,多实例生成的布局控制终于“可控且不串脸”了丨浙大团队

不靠死记布局也能按图生成,多实例生成的布局控制终于“可控且不串脸”了丨浙大团队

尽管扩散模型在单图像生成上已经日渐成熟,但当任务升级为高度定制化的多实例图像生成(Multi-Instance Image Generation, MIG)时,挑战随之显现:

来自主题: AI技术研报
9637 点击    2025-12-22 09:33
疑似GPT-6曝光!就在刚刚,奥特曼自曝时间表:OpenAI明年重心转向企业业务,一季度会发能力大增的新模型,算力和营收翻三倍!

疑似GPT-6曝光!就在刚刚,奥特曼自曝时间表:OpenAI明年重心转向企业业务,一季度会发能力大增的新模型,算力和营收翻三倍!

疑似GPT-6曝光!就在刚刚,奥特曼自曝时间表:OpenAI明年重心转向企业业务,一季度会发能力大增的新模型,算力和营收翻三倍!

本周三,OpenAI正式发布了GPT Image 1.5 功能。就在同一天,OpenAI CEO 山姆·奥特曼接受了《Big Technology Podcast》的采访。这期访谈的信息量非常密集,奥特曼从商业、产品和基础设施三个层面,系统回应了外界最关心的问题。多项表态释放出一个清晰信号:OpenAI正站在从“现象级产品公司”迈向“企业级AI平台”的关键拐点上。

来自主题: AI资讯
7971 点击    2025-12-20 10:29
刚刚,OpenAI推出全新ChatGPT Images,奥特曼亮出腹肌搞宣传

刚刚,OpenAI推出全新ChatGPT Images,奥特曼亮出腹肌搞宣传

刚刚,OpenAI推出全新ChatGPT Images,奥特曼亮出腹肌搞宣传

如果你刚刚打开 X 并且正好关注了 OpenAI 和山姆・奥特曼,那么你可能会看到这样的照片:

来自主题: AI资讯
7107 点击    2025-12-17 11:00