扒一扒OpenAI Sora的开发团队
扒一扒OpenAI Sora的开发团队现在世界上最受关注的技术团队是哪一支?Sora团队,已经来到聚光灯中心。
搜索
现在世界上最受关注的技术团队是哪一支?Sora团队,已经来到聚光灯中心。
AI,真的管用。过去,掌握一个技能可以在公司立足。现在情况大有不同,不仅要精通技能,还要高效完成工作。
2 月 18 日,年初九,很多人都迎来了龙年开工第一天。但与往年不同的是,今年的开工第一天就充满了「AI 的味道」。
“谷歌杀手”真的来了?
春节期间,OpenAI又悄悄投出了一颗深水炸弹——Sora。 也就是文生视频的AI模型,相较于此前的Pika、Runway,Sora生成的60秒视频更流畅,也更逼真。
龙年刚一开年,OpenAI又打开了新局面,这次火的是文生视频。2月16日凌晨,OpenAI发布了文生视频大模型Sora。Sora能够根据文本提示创建详细的视频、扩展现有视频中的叙述以及从静态图像生成场景。
本文讨论了AI生成视频的影响以及对创作者行业的颠覆性影响。作者认为AI的出现将导致创作者阶层变得尖锐,只有极少数优秀创作者能够保住声望和收益。
本文总结了关于Sora的四点启发,包括视觉数据训练出更强的泛化能力、OpenAI的Scaling Law路线、与AGI的第一次亲密接触以及OpenAI的宣传策略。
本文讨论了增长回报的不同来源,包括规模经济、网络效应、边学边做和观念重组。文章指出规模经济和网络效应在AI时代可能不再如以前那样可靠,而边学边做和观念重组的重要性逐渐凸显。
过去几天,OpenAI 非常热闹,先有 AI 大牛 Andrej Karpathy 官宣离职,后有视频生成模型 Sora 撼动 AI 圈。
现在世界上最受关注的技术团队是哪一支?Sora团队,已经来到聚光灯中心。
短短几天,「世界模型」雏形相继诞生,AGI真的离我们不远了?Sora之后,LeCun首发AI视频预测架构V-JEPA,能够以人类的理解方式看世界。
为何Sora会掀起滔天巨浪?Sora的技术,就是机器模拟我们世界的下一步。而且今天有人扒出,Sora创新的核心秘密时空Patches,竟是来自谷歌DeepMind和谢赛宁的论文成果。
视觉语言模型虽然强大,但缺乏空间推理能力,最近 Google 的新论文说它的 SpatialVLM 可以做,看看他们是怎么做的。
尽管收集人类对模型生成内容的相对质量的标签,并通过强化学习从人类反馈(RLHF)来微调无监督大语言模型,使其符合这些偏好的方法极大地推动了对话式人工智能的发展。
《纽约时报》援引三位知情人士消息,OpenAI 已经完成一项允许员工出售公司股份的交易。这家旧金山 AI 公司估值也因此水涨船高至 800 亿美元或更高(彭博社报道的估值是 860 亿美元)。
从英伟达的产品路线来看,在未来1-2 年,AI 芯片市场将再次天翻地覆。
Tech星球独家获悉,字节旗下多个部门加大投入对AI产品的研发,成果相继落地,包括抖音电商、巨量引擎等业务部门,其中动作最大的Flow部门除了上线豆包、扣子等AI产品外,还将推出AI角色互动APP“话炉”,以及一款或为图片方面的AI产品“PicPic”。
Sora表现强大的3点关键原因,以及我们作为普通人,应该如何面对新技术带来的冲击?
这两天,几乎整个AI圈的目光都被OpenAI发布Sora模型的新闻吸引了去。其实还有件事也值得关注,那就是Google继上周官宣Gemini 1.0 Ultra 后,火速推出下一代人工智能模型Gemini 1.5。
被收购2年,魅族决定不再做“传统手机”。
简单粗暴的理解,就是语言能力足够强大之后,它带来的泛化能力直接可以学习图像视频数据和它体现出的模式,然后还可以直接用学习来的图像生成模型最能理解的方式,给这些利用了引擎等已有的强大而成熟的视频生成技术的视觉模型模块下指令,最终生成我们看到的逼真而强大的对物理世界体现出“理解”的视频。
刚刚,我们经历了LLM划时代的一夜。谷歌又在深夜发炸弹,Gemini Ultra发布还没几天,Gemini 1.5就来了。卯足劲和OpenAI微软一较高下的谷歌,开始进入了高产模式。
普林斯顿大学和DeepMind的科学家用严谨的数学方法证明了大语言模型不是随机鹦鹉,规模越大能力一定越大。
如果允许学生用AI“作弊”,他们的成绩分布会发生怎样的变化?
微软首个为Windows而设的智能体(Agent) 亮相:基于GPT-4V,一句话就可以在多个应用中无缝切换,完成复杂任务。整个过程无需人为干预,其执行成功率和效率是GPT-4的两倍,GPT-3.5的四倍。
ChatGPT又要推出新功能了,这次名叫“记忆”(Memory)。如其名,作用就是让AI记住用户此前的对话内容。
新春佳节,苹果又给设计师们奉上了新的大礼——全新的AI动画助手!
鹅妹子嘤!AI硬件,自己也能动手做了!只需一个小时,成本不到八百块。
检索增强生成(RAG)和微调(Fine-tuning)是提升大语言模型性能的两种常用方法,那么到底哪种方法更好?在建设特定领域的应用时哪种更高效?微软的这篇论文供你选择时进行参考。