AI资讯新闻榜单内容搜索-ima

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ima
给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

随着多模态大语言模型(MLLMs)在视觉问答、图像描述等任务中的广泛应用,其推理能力尤其是数学几何问题的解决能力,逐渐成为研究热点。 然而,现有方法大多依赖模板生成图像 - 文本对,泛化能力有限,且视

来自主题: AI技术研报
5601 点击    2025-09-26 13:30
机器人界的「Imagenet 时刻」,李飞飞团队官宣全球顶级具身智能挑战赛

机器人界的「Imagenet 时刻」,李飞飞团队官宣全球顶级具身智能挑战赛

机器人界的「Imagenet 时刻」,李飞飞团队官宣全球顶级具身智能挑战赛

答案或许渐渐清晰。李飞飞团队与斯坦福 AI 实验室正式官宣:首届 BEHAVIOR 挑战赛将登陆 NeurIPS 2025。这是一个为具身智能量身定制的 “超级 benchmark”,涵盖真实家庭场景下最关键的 1000 个日常任务(烹饪、清洁、整理……),并首次以 50 个完整长时段任务作为核心赛题,考验机器人能否在逼真的虚拟环境中完成真正贴近人类生活的操作。

来自主题: AI资讯
6549 点击    2025-09-25 10:58
Qwen开源版Banana来了!原生支持ControlNet

Qwen开源版Banana来了!原生支持ControlNet

Qwen开源版Banana来了!原生支持ControlNet

刚刚,Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。不仅支持多图融合,提供“人物+人物”,“人物+商品”,“人物+场景” 等多种玩法,还增强了人物、商品、文字等单图一致性。

来自主题: AI资讯
7838 点击    2025-09-24 09:58
阿里一夜扔出三个开源王炸!猛刷32项开源SOTA

阿里一夜扔出三个开源王炸!猛刷32项开源SOTA

阿里一夜扔出三个开源王炸!猛刷32项开源SOTA

深夜,阿里通义大模型团队连放三个大招:开源原生全模态大模型Qwen3-Omni、语音生成模型Qwen3-TTS、图像编辑模型Qwen-Image-Edit-2509更新。Qwen3-Omni能无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音输出。

来自主题: AI资讯
6796 点击    2025-09-23 16:33
谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上

谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上

谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上

谷歌这只「香蕉」火得有些疯狂:Nano Banana(即 Gemini 2.5 Flash Image)自 8 月底上线以来,仅用几周就吸引了超过 1,000 万新用户,并在 Gemini 应用中完成了 2 亿次图像编辑请求

来自主题: AI产品测评
6233 点击    2025-09-16 09:58
为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新

为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新

为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新

GPT-5 的发布,可以看作是一个分水岭。练习时长两年半的 GPT-5,并没有展现出和 GPT-4 本质上的差别,甚至因为模型的预设人格引发了用户的反感情绪。

来自主题: AI资讯
7436 点击    2025-09-15 16:12
美团悄悄上线了生活Agent,懒人的春天真的要来了。

美团悄悄上线了生活Agent,懒人的春天真的要来了。

美团悄悄上线了生活Agent,懒人的春天真的要来了。

啊?今天早上9点多的时候。 美团上线了他们的首个生活类Agent。 名字,叫小美。 大厂们卷疯了。 这战场,真的从WAIMAI打到了AI了我靠。 而且还真的居然被我猜中了。 我上周写过美团的开源大模型

来自主题: AI资讯
8148 点击    2025-09-13 11:28
任意骨骼系统的模型都能驱动?AnimaX提出基于世界模型的3D动画生成新范式

任意骨骼系统的模型都能驱动?AnimaX提出基于世界模型的3D动画生成新范式

任意骨骼系统的模型都能驱动?AnimaX提出基于世界模型的3D动画生成新范式

在游戏、影视制作、虚拟人和交互式内容创作等行业中,高质量的 3D 动画是实现真实感与表现力的基础。然而,传统计算机图形学中的动画制作通常依赖于骨骼绑定与关键帧编辑,这一流程虽然能够带来高质量与精细控制,但需要经验丰富的艺术家投入大量人力与时间,代价昂贵。

来自主题: AI技术研报
7024 点击    2025-09-07 11:38
又多了一个哄孩子AI神器,一张破涂鸦竟能秒变迪士尼动画

又多了一个哄孩子AI神器,一张破涂鸦竟能秒变迪士尼动画

又多了一个哄孩子AI神器,一张破涂鸦竟能秒变迪士尼动画

年轻父母又多了一个哄小孩法子。 前段时间,博主 Rory Flynn 在 X 上发了个帖子,说他妈妈发来一张 30 年前的涂鸦画,他反手就用 Midjourney 做成了「妈妈拿彩虹木勺大战巨龙」动画。

来自主题: AI资讯
6025 点击    2025-09-05 12:38
Nano-Banana 核心团队首次揭秘,全球最火的 AI 生图工具是怎么打造的

Nano-Banana 核心团队首次揭秘,全球最火的 AI 生图工具是怎么打造的

Nano-Banana 核心团队首次揭秘,全球最火的 AI 生图工具是怎么打造的

在图像生成上,Google 其实已经有 Imagen 4 这样的文生图模型,为什么 nano banana 最后还是由 Google 带来的?但这确实不是偶然或者瞎猜的,nano banana 是结合了 Google 多个团队的项目成果。首先就是 Gemini 强大的世界知识与指令遵循能力,其次就是 Google 内部顶尖文生图模型 Imagen,所提供的极致图像美学与自然度追求。

来自主题: AI技术研报
9271 点击    2025-09-02 09:24