
上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型
上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型要让视频生成模型真正成为模拟真实物理世界的「世界模型」,必须具备长时间生成并保留场景记忆的能力。然而,交互式长视频生成一直面临一个致命短板:缺乏稳定的场景记忆。镜头稍作移动再转回,眼前景物就可能「换了个世界」。
要让视频生成模型真正成为模拟真实物理世界的「世界模型」,必须具备长时间生成并保留场景记忆的能力。然而,交互式长视频生成一直面临一个致命短板:缺乏稳定的场景记忆。镜头稍作移动再转回,眼前景物就可能「换了个世界」。
时至今日,AI早已不算什么新兴技术。 从写PPT到修自拍再到情感咨询,它以各种形态渗你我日常生活。
Genie 3来了!这或许是最接近「模拟世界」的AI魔法。只需一句话,它就能生成一个动态、可互动的世界——角色能互动、下水会溅起水花,甚至还能记住一分钟前的细节。DeepMind研究者直言:Genie 3是通向AGI的关键一步。
视频Agent生成过程中顶多也就是让我点点选项,或者直接针对某一处不满意的地方用对话形式修改,甚至可能我提了一个意见,直接整个片子都给我换了个不一样的。
制作一个视频需要几步?可以简单概括为:拍摄 + 配音 + 剪辑。 还记得 veo3 发布时引起的轰动吗?「音画同步」功能的革命性直接把其他视频生成模型按在地上摩擦,拍摄 + 配音 + 粗剪一键搞定。
穿着运动鞋的鲨鱼踩着滑板冲浪,头顶卡布奇诺泡沫的芭蕾舞者在水晶球里旋转——这些被称为“脑残视频”(Brainrot Videos)的荒诞内容正在TikTok和Instagram上病毒式传播,年轻用户群体疯狂追捧这些脱离现实逻辑的视觉梗图,单条播放量动辄突破千万。
一家成立不足两年的以色列公司Decart突然以31亿美元估值拿下1亿美元B轮融资,领投方是红杉资本,Benchmark、Zeev Ventures等顶级风投也争相入局。
一年前,X 还深陷泰勒·斯威夫特的深度伪造(Deepfake)不雅照风波中。一年后,它的老板马斯克,亲自为用户送来了生产这些「不雅照」的工具,并大肆宣传。xAI 的新功能 Grok Imagine,提供了一个名为「Spicy」的火辣模式,被媒体证实可以一键生成名人的部分裸露视频。
AI 生成的"脑残"视频正在互联网上遍地开花,引发广泛关注。这些以离奇角色为特色的短片——比如穿着运动鞋的鲨鱼和顶着卡布奇诺脑袋的芭蕾舞者,目前正受到年轻用户群体的热捧。
AIGC时代最火的创作者是谁?是不是第一时间也想不到某个具体的名字或者账号。这就是如今AI创作圈的真实现状——模型越做越强,工具越来越多,但真正凭AI创作出圈的人,依然寥寥无几。