
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍DiT 都能用,生成视频无质量损失,也不需要训练。
DiT 都能用,生成视频无质量损失,也不需要训练。
Sora新大片又又又火了,还是个正经的商业宣传片。
日前,旷视科技发布了一项新的开源 AI 人像视频生成框架 ——MegActor。基于该框架,用户只需输入一张静态的肖像图片,以及一段视频(演讲、表情包、rap)文件,即可生成一段表情丰富、动作一致的 AI 人像视频。
没想到,刚刚上线了图生视频和视频续写功能的可灵AI,竟已在全世界互联网上引爆了视频创作的热潮!
今年 2 月,Sora 吸引了人们对视频生成赛道的关注。而这一赛道的头部创业公司爱诗科技,也开始进入人们的视野。
中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜!
难度大升级的多任务长视频理解评测基准MLVU来了!
从任意单目视频重建可渲染的动态场景是计算机视觉研究领域的一个圣杯。
继Sora官宣之后,多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来,LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力,文生视频、图生视频的新前沿不断被扩展令大家惊喜不已,抱有期待。
测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了,针对视频理解能力的那种。