AI资讯新闻榜单内容搜索-生成模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 生成模型
免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍

免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍

免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍

现在,视频生成模型无需训练即可加速了?! Meta提出了一种新方法AdaCache,能够加速DiT模型,而且是无需额外训练的那种(即插即用)。

来自主题: AI技术研报
3200 点击    2024-11-07 20:43
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能,还能通过选择最佳候选图像来实际改善生成的图像。

来自主题: AI技术研报
4184 点击    2024-11-06 15:07
MPDS:提升电影海报生成效率的新型数据集

MPDS:提升电影海报生成效率的新型数据集

MPDS:提升电影海报生成效率的新型数据集

MPDS(Movie Posters Dataset)是一个创新的电影海报数据集,旨在解决现有图像生成模型在制作电影海报时面临的挑战。

来自主题: AI技术研报
9106 点击    2024-11-02 17:21
Allegro:开创商业级视频生成新纪元

Allegro:开创商业级视频生成新纪元

Allegro:开创商业级视频生成新纪元

Allegro 是一款先进的商业级视频生成模型,由Rhymes AI团队开发。它通过将描述性文本转换为动态视觉内容,为用户提供了一种灵活且可控的视频创作方法。

来自主题: AI技术研报
6339 点击    2024-11-02 17:15
NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题

NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题

NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题

随着扩散生成模型的发展,人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐步去噪而得到高质量的采样。当前,许多应用都涉及扩散模型的反演,即找到一个生成样本对应的初始噪声。当前的采样器不能兼顾反演的准确性和采样的质量。

来自主题: AI技术研报
6739 点击    2024-11-02 17:08
Unbounded:来自Google的AI驱动角色模拟无限游戏

Unbounded:来自Google的AI驱动角色模拟无限游戏

Unbounded:来自Google的AI驱动角色模拟无限游戏

Unbounded 是由 Google 研发的一个创新的角色模拟生成性无限游戏,它通过采用最新的生成模型技术,突破了传统视频游戏的局限。

来自主题: AI技术研报
7543 点击    2024-11-01 12:34
PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA(emPowering Unified MLLM with Multi-grAnular visual generation)是一项创新的多模态大型语言模型(MLLM),由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示,巧妙地平衡了视觉生成任务中的多样性与可控性。

来自主题: AI技术研报
3924 点击    2024-10-29 14:32
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍

谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍

谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍

在NLP领域,研究者们已经充分认识并认可了表征学习的重要性,那么视觉领域的生成模型呢?最近,谢赛宁团队发表的一篇研究就拿出了非常有力的证据:Representation matters!

来自主题: AI技术研报
3488 点击    2024-10-23 13:37
视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化

视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化

视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化

现在正是「文本生视频」赛道百花齐放的时代,而且其应用场景非常多,比如生成创意视频内容、创建游戏场景、制作动画和电影。

来自主题: AI技术研报
3813 点击    2024-10-20 16:55
实测13个类Sora视频生成模型,8000多个案例,一次看个够

实测13个类Sora视频生成模型,8000多个案例,一次看个够

实测13个类Sora视频生成模型,8000多个案例,一次看个够

腾讯 AI Lab 联合中科大发布了一份针对类 SORA 视频生成模型的测评报告,重点聚焦目前最前沿的类 SORA DiT 架构的高质量视频生成闭源模型

来自主题: AI技术研报
3509 点击    2024-10-16 16:03