ICML 2025 | 视频生成模型无损加速两倍,秘诀竟然是「抓住attention的时空稀疏性」
ICML 2025 | 视频生成模型无损加速两倍,秘诀竟然是「抓住attention的时空稀疏性」自 OpenAI 发布 Sora 以来,AI 视频生成技术进入快速爆发阶段。凭借扩散模型强大的生成能力,我们已经可以看到接近现实的视频生成效果。但在模型逼真度不断提升的同时,速度瓶颈却成为横亘在大规模应用道路上的最大障碍。
自 OpenAI 发布 Sora 以来,AI 视频生成技术进入快速爆发阶段。凭借扩散模型强大的生成能力,我们已经可以看到接近现实的视频生成效果。但在模型逼真度不断提升的同时,速度瓶颈却成为横亘在大规模应用道路上的最大障碍。
法国初创Mistral,刚刚推出定价碾压DeepSeek V3的模型,而模型性能,却超过Claude Sonnet 3.7的90%。不过在网友们的实测中,它却翻车了?有人建议:不必下载浪费流量和硬盘空间。
字节开源图像编辑新方法,比当前SOTA方法提高9.19%的性能,只用了1/30的训练数据和1/13参数规模的模型。
大家好,我是五一还在加班给大家写文章的Max 不会吧不会吧,不会真的只有我五一假期还在加班工作吧?
紧接着 Gemini 开了教育优惠之后,Cursor Pro 在昨晚也提供了教育优惠,融到钱了就是财大气粗!在校学生凭 edu 邮箱可以直接验证领取一整年的免费 Cursor Pro,具体的教程可以去小红书上搜。但目前网上的教程全需要教育邮箱,作者本人亲测无需在校身份,无需 edu 也可白嫖~教程如下:
在前端开发领域,Vue 框架一直以其易用性和灵活性受到广大开发者的喜爱。而如今,Vue 生态在人工智能(AI)领域的应用上又迈出了重要的一步。尤雨溪近日宣布,Vue、Vite 和 Rolldown 的文档网站均已添加了llms.txt文件,这一举措旨在让大型语言模型(LLM)更方便地理解这些前端技术。
宝子们,今天必须给大家分享一个超重磅的消息!最近,两款超厉害的 AI 助手 ——Cursor Pro 和 Gemini Pro,居然都宣布面向学生群体免费开放使用一整年!这可真是实打实的福利,错过可就亏大啦!
鹅厂最新的3D生成模型,狠狠地圈了一波粉,甚至有人拿它来创作小游戏动画了。
Ilya Sutskever,曾亲手缔造OpenAI的联合创始人,仿佛人间蒸发一般,只留下一家没有产品、没有收入、却估值高达300亿美元的公司Safe Superintelligence。当Altman在忙着打官司、重组OpenAI时,Ilya选择了「消失」,也许只为等待那个值得他出手的「超级智能」。
从 2023 年的 Sora 到如今的可灵、Vidu、通义万相,AIGC 生成式技术的魔法席卷全球,打开了 AI 应用落地的大门。
随着模型核心能力的进步,我们计划逐步将一些功能从产品中移除,或者至少将它们对用户极度隐藏,除非他们真的需要。
在未来两到三年内,中国的AI市场可能会达到约500亿美元。
摩根士丹利的案例表明,企业应用AI离不开快速试错与优化。AI通过分析海量数据打造个性化体验,Indeed的职位推荐和Lowe’s搜索优化证明了数据与AI结合的巨大潜力。
据内部人士透露,由 OpenAI 前训练后研究副总裁利亚姆·费杜斯创立的初创公司 Periodic Labs,已向潜在投资者表示希望以至少 10 亿美元的估值筹集数亿美元资金。这对于仅成立两个月的初创企业来说是一个相当高的估值。
本周三,知名 AI 创业公司,曾发布「全球首个 AI 软件工程师」的 Cognition AI 开源了一款使用强化学习,用于编写 CUDA 内核的大模型 Kevin-32B。
没必要为了某个「新范式」去创业。
随着Gemini、GPT-4o等商业大模型把基于文本的图像编辑这一任务再次推向高峰,获取更高质量的编辑数据用于训练、以及训练更大参数量的模型似乎成了提高图像编辑性能的唯一出路。然而浙大哈佛这个团队却反其道而行之,仅用以往工作0.1%的数据量(获取自公开数据集)和1%的训练参数,以极低成本实现了图像的高质量编辑,在一些方面媲美甚至超越商业大模型!
随着AI Agent 在工作场所日益普及,个人可能会与之紧密协作。波士顿咨询集团报告指出,未来五年内,AI Agent 市场预计将以45%的复合年增长率扩张。
谷歌Gemini 2.5 Pro(I/O版)横空出世,强势登顶LMAreana,斩获文本、视觉、编码三连冠,甚至编程能力全面碾压Claude 3.7,地表最强编码模型诞生。
两周前,我用飞猪和 Manus 来了一场旅行计划对比, 看上去它们做出来的都相当“合理”, 特别是 Manus,要不是我去过我真以为一个小时能逛完奈良公园, 所以这次五一,整整120小时行程,我叫上了三个朋友,按照飞猪给出的旅行计划,体验我第一次游轮出行!
强化学习(RL)是当今 AI 领域最热门的词汇之一。近日,一篇长文梳理了新时代的强化学习范式对于模型提升的作用,同时还探索了强化学习对去中心化的意义。
Agent 即一系列自动化帮助人类完成具体任务的智能体或者智能助手,可以自主进行推理,与环境进行交互并获取环境以及人类反馈,从而最终完成给定的任务,比如最近爆火的 Manus 以及 OpenAI 的 o3 等一系列模型和框架。
Qwen3强势刷新开源模型SOTA,但如何让其在资源受限场景中,既能实现低比特量化,又能保证模型“智商”不掉线?
因为大家太过热情, Gemini 2.5提前重磅更新—— 史上最强编码模型Gemini 2.5 Pro Preview的I/O版。
Anysphere对中国创业公司有哪些启示?
JetBrains 被大量差评弄崩溃了~
用资本换时间,用布局换路径,用入口控未来。
104个学生里,只有15个真人,其余都是ChatGPT
大家有没有发现,AI竞争的牌桌上,几乎只剩中国和美国两个选手了?
我女儿读初中,周末疯玩两天,晚上狂补作业。作文是老大难,她捣鼓着用豆包写作文。