AI资讯新闻榜单内容搜索-Ai视频

浙大李玺团队：指代表达理解新方法，ScanFormer粗到细迭代消除视觉冗余

作为基础的视觉语言任务，指代表达理解（referring expression comprehension, REC）根据自然语言描述来定位图中被指代的目标。REC 模型通常由三部分组成：视觉编码器、文本编码器和跨模态交互，分别用于提取视觉特征、文本特征和跨模态特征特征交互与增强。

来自主题: AI技术研报

7356 点击 2024-08-20 14:36

BGM 中充满了“喵喵喵”的可爱声音，AI 绘制的猫咪们从事着送外卖、工地打工、喝咖啡等，这些胖橘猫的拟人化剧情让人看得津津有味。

来自主题: AI资讯

10382 点击 2024-08-19 17:02

更适合中国宝宝体质的图生视频大模型。

来自主题: AI资讯

7760 点击 2024-08-19 16:54

「我们应该放下固化和抵抗的思维，拥抱这个碎片化信息时代。」 2023 年 12 月初，导演黄建新在北京电影学院北影大讲堂上感慨，比起电影，竖屏短剧兴起才真正形成了全球输出。

来自主题: AI资讯

9458 点击 2024-08-19 14:58

昆仑万维推出AI短剧创作平台SkyReels。

来自主题: AI资讯

10763 点击 2024-08-19 14:40

席卷开源界的AI生图王者诞生了！发布半个月，Flux已经成为替代Midjourney的宠儿。各路开发者们开始用自己的照片微调LoRA，一人拿捏多种风格。

来自主题: AI资讯

11576 点击 2024-08-19 14:32

从AI文字、AI图片到AI视频

来自主题: AI资讯

7166 点击 2024-08-19 10:25

只用不到10%的训练参数，就能实现ControlNet一样的可控生成！

来自主题: AI资讯

6235 点击 2024-08-17 13:56

我们正在见证又一轮技术革新，这一次是 AIGC 为个体提供表达自我的工具，让创作变得更加容易和普及，但背后的推动力却并不是「大」模型。

来自主题: AI资讯

7365 点击 2024-08-16 15:08

惊爆！马斯克在某超市做「小偷」，当场被摄像头拍下，是真还是假，没人说得清。Grok被发现没有护栏后，网友们直接冲爆了，霉霉、川普、马里奥、米老鼠……Grok生图简直令人瞠目结舌。

来自主题: AI资讯

7719 点击 2024-08-16 14:37