
为什么说Sora是世界的模拟器?
为什么说Sora是世界的模拟器?AI 视频生成的「ChatGPT时刻」比想象中提前了6个月。Sora 的诞生意味着什么,何以堪称「世界的模拟器」?
AI 视频生成的「ChatGPT时刻」比想象中提前了6个月。Sora 的诞生意味着什么,何以堪称「世界的模拟器」?
2024年的开年震撼同样来自OpenAI。节后还没开工,Altman就带着继ChatGPT的第二个杀手级应用Sora大杀四方。我们看完那条长达60s的演示视频后,脑中只有一句话:大家谁都别想玩了。
春节期间,OpenAI又悄悄投出了一颗深水炸弹——Sora。 也就是文生视频的AI模型,相较于此前的Pika、Runway,Sora生成的60秒视频更流畅,也更逼真。
龙年刚一开年,OpenAI又打开了新局面,这次火的是文生视频。2月16日凌晨,OpenAI发布了文生视频大模型Sora。Sora能够根据文本提示创建详细的视频、扩展现有视频中的叙述以及从静态图像生成场景。
本文讨论了AI生成视频的影响以及对创作者行业的颠覆性影响。作者认为AI的出现将导致创作者阶层变得尖锐,只有极少数优秀创作者能够保住声望和收益。
短短几天,「世界模型」雏形相继诞生,AGI真的离我们不远了?Sora之后,LeCun首发AI视频预测架构V-JEPA,能够以人类的理解方式看世界。
Sora表现强大的3点关键原因,以及我们作为普通人,应该如何面对新技术带来的冲击?
简单粗暴的理解,就是语言能力足够强大之后,它带来的泛化能力直接可以学习图像视频数据和它体现出的模式,然后还可以直接用学习来的图像生成模型最能理解的方式,给这些利用了引擎等已有的强大而成熟的视频生成技术的视觉模型模块下指令,最终生成我们看到的逼真而强大的对物理世界体现出“理解”的视频。
就在十几个小时之前,OpenAI再一次放出大招,发布了一个有望改变世界的产品,那就是文字生成视频的Sora模型。
OpenAI发布了首个AI视频模型Sora,该模型能够根据文字指令生成逼真且充满想象力的视频,且能够生成长达1分钟的连贯视频。通过提供多帧预测,Sora实现了一镜到底的效果。