何恺明重磅新作:Just image Transformers让去噪模型回归基本功
何恺明重磅新作:Just image Transformers让去噪模型回归基本功大家都知道,图像生成和去噪扩散模型是密不可分的。高质量的图像生成都通过扩散模型实现。
大家都知道,图像生成和去噪扩散模型是密不可分的。高质量的图像生成都通过扩散模型实现。
周末和几个老同学聚了聚。大家都在互联网行业,聊着聊着话题自然绕到 AI。
AI正悄悄蚕食整整一代人的入场券。新人难觅岗位,毕业生不得不面对「没有经验就没有工作,没有工作就无法获得经验」的恶性循环。当实验中的AI为「活下去」开口敲诈,人类才真正看见技术失控的阴影。在淘汰一半初级白领与缔造10%增长之间,我们还有多少时间为AI加装护栏?社会命运不能只寄托于几家公司的良知,更需要制度保障。
一次「常规更新」搞崩半个地球,Cloudflare CTO紧急谢罪:我们搞砸了!Cloudflare自杀式Bug引发连锁反应,波及全球20%网站。当数百万爬虫撑爆了防御名单,Cloudflare的崩溃揭示了AI时代最深的基建隐忧,人类还能跟得上AI进化的脚本吗?
就在几小时前,Gemini 3.0重磅发布。随着而来的还有其颠覆性的AI原生IDE产品——Antigravity,这不只是一个新工具那么简单。谷歌的这次发布,将三个核心开发工具,AI代理(Agent)、代码编辑器(Editor)和浏览器(Browser) 集成在了一起,构建了由AI驱动、从编码、研究、测试到验证的完整闭环,一举打通了自家的生态。
刚刚,才离开 Meta 不久的 Soumith Chintala 发布了一条推文,盛赞 Thinking Machines Lab(以下简称 TML)的人很了不起(incredible)。与此同时,这位 PyTorch 之父也更新了自己的个人介绍,正式官宣加入 TML,并表示正在这家估值已达 500 亿美元的创业公司「创造新东西(Building new things)」 。
凌晨,谷歌终极杀器Gemini 3重磅来袭,一出手就是Pro顶配版,号称「史上最强推理+多模态+氛围编程」三合一AI战神!基准测试横扫全场,就连GPT-5.1也被斩于马下,AI的下一个时代开启。而且,一上来就是顶配的Gemini 3 Pro——迄今推理最强,多模态理解最强,以及「智能体」+「氛围编程」最强的模型!
就在前两天,深圳一家名为 Inspire Curve 的创企设计出的 AI 概念相机,获得了有“设计界奥斯卡”美誉的 iF 设计奖。从媒体报道给出的信息看,两款产品的共通之处是将 AI 生图模型引入拍摄过程,让用户在 AI 的帮助下,一键“出片”。
人类首个AI创作型导演诞生!Josh Wallace Kerrigan用GenAI工具,构建Neural Viz的外星宇宙,避免硬碰AI短板,转而实验伪纪录片形式。
一年半之前,影眸科技年轻的创始团队去到旧金山,带着还没正式发布的 3D 生成模型 Rodin,在 GDC(游戏开发者大会)上向全球最顶级的游戏开发者们演示 demo。