美国视频生成老炮儿,入局世界模型
美国视频生成老炮儿,入局世界模型世界模型赛道,又有老面孔新鲜入局! 就在刚刚,Runway发布旗下首个通用世界模型GWM-1。 不止于此,还打包发布了一系列世界模型变体:模拟真实环境的GWM Worlds;
世界模型赛道,又有老面孔新鲜入局! 就在刚刚,Runway发布旗下首个通用世界模型GWM-1。 不止于此,还打包发布了一系列世界模型变体:模拟真实环境的GWM Worlds;
GPT-5.2打赢Gemini 3.0 Pro,竟是靠高推理与海量Token「作弊」?网友的这个发现,在AI社区一石激起千层浪。更多网友七嘴八舌表示:GPT-5.2,并没有那么好用!
David Sacks 最近带着他的新产品 Glue 正式走向市场,并刚刚完成了 2000 万美元的 A 轮融资。这个名字你可能很熟悉,他是 PayPal 黑帮成员之一,也是 Yammer 的创始人,更是 All-In 播客的联合主持人
尽管最近 AI Agent 很火,真正落地到垂直行业里的例子依旧不太多。尤其是我们今天要讨论的行业:非标、分散、高度依赖沟通:达人营销。对于科技公司来说,达人营销非常重要。但是直到今天,很多团队依然在依赖 Excel 表格管理达人,靠人工手动发送成百上千封「碰碰运气」的邮件。
想象一下,只需要一句话描述,AI 就能为你拍出一部完整的短剧?为了让这个想法变成现实,香港大学黄超教授团队开源了 ViMax 框架,并在 GitHub 获得 1.4k + 星标,专注于 Agentic Video Generation 的前沿探索。通过多智能体协作,ViMax 实现了真正的 "自编自导自演"—— 从创意构思到成片输出的完整自动化,把传统影视制作的每个环节都搬进了 AI 世界。
对了,这个工具叫Seko,我相信大家应该也从一些大佬那里刷到过吧。它是一个Agent,只需要给一个方向,就能自动直出剧本、分镜、人物、场景、风格、批量出分镜图、批量转视频,甚至配音,BGM都给你裁剪卡上了,最后导出一个完整的作品。
扩散语言模型(Diffusion Language Models)以其独特的 “全局规划” 与并行解码能力广为人知,成为 LLM 领域的全新范式之一。然而在 Any-order 解码模式下,其通常面临
主攻 AI 视频与多媒体生成技术的独角兽 Runway 也来了一波大的:一口气来了 5 个「激动人心的宣布」。这一波更新之猛,甚至让人觉得他们是不是把过去半年的大招一次性全放了出来。Runway 这一波发布,不仅刷新了视频生成的各项指标,更重要的是,他们正式对外展示了其在通用世界模型(General World Models/GWM)上的野心。
要吊打 Gemini 的 GPT 5.2 在今天凌晨正式发布了,向所有用户推出。 上个月刚刚退订掉 ChatGPT Plus,转到 Gemini,这次需要因为 GPT-5.2 再回去吗? 看完下面这些网友真实的体验分享,还有 APPSO 的上手实测,或许能有个答案。
昨夜,OpenAI用专家级GPT-5.2复仇Gemini 3成功!而在GPT-5.2发布前一个多小时,谷歌就率先推出全新版Gemini Deep Research Agent。谷歌对Gemini深度研究进行了重新构想,使其比以往任何时候都更加强大。