AI资讯新闻榜单内容搜索-扩散模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 扩散模型
自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

第8届CoRL于2024年11月6日至9日在德国慕尼黑举行,展示了机器人学习领域的前沿研究和发展,尤其是在自主系统、机器人控制和多模态人工智能领域。

来自主题: AI技术研报
6317 点击    2024-11-12 17:33
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

【新智元导读】刚刚,一款专为消费级显卡设计的全新非自回归掩码图像建模的文本到图像生成模型——Meissonic发布,标志着图像生成即将进入「端侧时代」。

来自主题: AI技术研报
4288 点击    2024-11-12 15:06
收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法

收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法

收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法

在 HyperAI超神经联合出品的 COSCon’24 AI for Science 论坛中,来自清华大学电子工程系城市科学与计算研究中心的博士后研究员丁璟韬带来了深度分享,以下为演讲精华实录。

来自主题: AI技术研报
5138 点击    2024-11-12 13:32
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能,还能通过选择最佳候选图像来实际改善生成的图像。

来自主题: AI技术研报
4078 点击    2024-11-06 15:07
Bifröst:基于语言指令的3D感知图像合成技术

Bifröst:基于语言指令的3D感知图像合成技术

Bifröst:基于语言指令的3D感知图像合成技术

Bifröst 是一个创新的3D感知图像合成框架,它利用扩散模型来执行基于语言指令的图像合成任务。

来自主题: AI技术研报
4510 点击    2024-11-05 19:29
NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题

NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题

NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题

随着扩散生成模型的发展,人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐步去噪而得到高质量的采样。当前,许多应用都涉及扩散模型的反演,即找到一个生成样本对应的初始噪声。当前的采样器不能兼顾反演的准确性和采样的质量。

来自主题: AI技术研报
6627 点击    2024-11-02 17:08
每帧都是AI实时生成的,全球首款AI游戏问世了!

每帧都是AI实时生成的,全球首款AI游戏问世了!

每帧都是AI实时生成的,全球首款AI游戏问世了!

两个月前,我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。他们实现了历史性的突破,从此不再需要游戏引擎,AI 能基于扩散模型,为玩家生成实时可玩的游戏。

来自主题: AI资讯
7330 点击    2024-11-02 16:23
一个模型走天下!智源提出全新扩散架构OmniGen,AI生图进入「一键生成」时代

一个模型走天下!智源提出全新扩散架构OmniGen,AI生图进入「一键生成」时代

一个模型走天下!智源提出全新扩散架构OmniGen,AI生图进入「一键生成」时代

LLM统一了语言生成任务,图像生成可以吗?就在刚刚,智源推出了全新扩散模型架构OmniGen,单个模型就能生成图像,彻底告别繁琐工作流!

来自主题: AI技术研报
4249 点击    2024-10-29 14:38
新扩散模型OmniGen一统图像生成,架构还高度简化、易用

新扩散模型OmniGen一统图像生成,架构还高度简化、易用

新扩散模型OmniGen一统图像生成,架构还高度简化、易用

大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。

来自主题: AI技术研报
10580 点击    2024-10-29 13:38