AI资讯新闻榜单内容搜索-生成模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 生成模型
MemoRAG:重新定义长期记忆的AI问答模型

MemoRAG:重新定义长期记忆的AI问答模型

MemoRAG:重新定义长期记忆的AI问答模型

随着人工智能的发展,AI问答模型在各种应用场景中表现出色,尤其是在信息检索和知识问答领域。传统的RAG模型通过结合外部知识库的实时检索与生成模型,极大地提升了回答的准确性。然而,这类模型仍然面临一个重要挑战:无法有效处理长期信息,尤其是在需要持续记忆和动态更新知识的场景中表现不佳。

来自主题: AI资讯
5285 点击    2024-11-19 09:36
视频生成无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 | NeurIPS

视频生成无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 | NeurIPS

视频生成无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 | NeurIPS

卡内基梅隆大学提出了视频生成模型加速方法Run-Length Tokenization(RLT),被NeurIPS 2024选为Spotlight论文。 在精度几乎没有损失的前提下,RLT可以让模型训练和推理速度双双提升。

来自主题: AI技术研报
5727 点击    2024-11-17 14:10
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

【新智元导读】刚刚,一款专为消费级显卡设计的全新非自回归掩码图像建模的文本到图像生成模型——Meissonic发布,标志着图像生成即将进入「端侧时代」。

来自主题: AI技术研报
4293 点击    2024-11-12 15:06
教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出

教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出

教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出

又有机会跟着大神学习了! 今年 2 月起,何恺明已经开始了自己在 MIT 的副教授职业生涯,并在 3 月 7 日走上讲台完成了「人生中教的第一堂课」。

来自主题: AI资讯
4077 点击    2024-11-10 14:21
LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示,基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。之后更是直言,像 Sora 这样通过生成像素来建模世界的方式注定要失败。

来自主题: AI技术研报
3718 点击    2024-11-08 19:14
免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍

免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍

免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍

现在,视频生成模型无需训练即可加速了?! Meta提出了一种新方法AdaCache,能够加速DiT模型,而且是无需额外训练的那种(即插即用)。

来自主题: AI技术研报
3089 点击    2024-11-07 20:43
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能,还能通过选择最佳候选图像来实际改善生成的图像。

来自主题: AI技术研报
4079 点击    2024-11-06 15:07
MPDS:提升电影海报生成效率的新型数据集

MPDS:提升电影海报生成效率的新型数据集

MPDS:提升电影海报生成效率的新型数据集

MPDS(Movie Posters Dataset)是一个创新的电影海报数据集,旨在解决现有图像生成模型在制作电影海报时面临的挑战。

来自主题: AI技术研报
8920 点击    2024-11-02 17:21
Allegro:开创商业级视频生成新纪元

Allegro:开创商业级视频生成新纪元

Allegro:开创商业级视频生成新纪元

Allegro 是一款先进的商业级视频生成模型,由Rhymes AI团队开发。它通过将描述性文本转换为动态视觉内容,为用户提供了一种灵活且可控的视频创作方法。

来自主题: AI技术研报
6229 点击    2024-11-02 17:15