
人刚毕业,颠覆整个AI界:扒一扒Sora两带头人博士论文
人刚毕业,颠覆整个AI界:扒一扒Sora两带头人博士论文看看这个时代最伟大 AI 学者的研究脉络。
看看这个时代最伟大 AI 学者的研究脉络。
最近 Open-Sora 全新开源的 1.2 版本,可以生成最长 16s 的 720p 高清视频,官方视频效果如下:
只需几分钟、一张图或一句话,就能完成时空一致的4D内容生成。
英伟达投的Sora竞品,服务器又双叒被挤爆了!
4月,一条“小丑开演唱会”的短视频一炮而红,随后“小丑爆破医院”“马斯克蜘蛛侠斗舞”等AI视频在社交网络爆红,上演着不同人物的“瞬息全宇宙”。
尤洋团队新作,首个基于DiT的实时视频生成方法来了!
本文将为大家介绍CVPR 2024 Highlight的论文LangSplat: 3D Language Gaussian Splatting(三维语义高斯泼溅)。LangSplat在开放文本目标定位和语义分割任务上达到SOTA性能。在1440×1080分辨率的图像上,查询速度比之前的SOTA方法LERF快了199倍。代码已开源。
DiT 都能用,生成视频无质量损失,也不需要训练。
Sora新大片又又又火了,还是个正经的商业宣传片。
日前,旷视科技发布了一项新的开源 AI 人像视频生成框架 ——MegActor。基于该框架,用户只需输入一张静态的肖像图片,以及一段视频(演讲、表情包、rap)文件,即可生成一段表情丰富、动作一致的 AI 人像视频。