解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D
解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D浙大联合微软亚洲研究院最新提出的World-R1,不改架构、不要3D数据,纯靠强化学习就让视频生成模型学会了“理解”三维世界。World-R1 的出发点很简单:预训练的视频模型里面已经有 3D 知识了,只是“沉睡”着。用强化学习把它叫醒就行。
搜索
浙大联合微软亚洲研究院最新提出的World-R1,不改架构、不要3D数据,纯靠强化学习就让视频生成模型学会了“理解”三维世界。World-R1 的出发点很简单:预训练的视频模型里面已经有 3D 知识了,只是“沉睡”着。用强化学习把它叫醒就行。
微软用一套多 Agent 系统在 AI 漏洞发现的顶级基准测试上拿下第一,超过 Anthropic 最强模型 Mythos 五个百分点。诡异的是,微软自己并没有一个能打的前沿模型。它用别人的模型组了个系统,打败了造出这些模型的公司。这对AI竞争格局的启示,比这个工具挖出了大量 Windows 漏洞本身更重要。
您有没有想过:在代码Agent里,执行终端命令、跑测试、读报错、总结日志这种任务,用Claude Opus、Claude Sonnet、GPT-5.3-Codex这类昂贵Token的大模型来执行,是不是有点浪费?一定要这么做吗?
就在上周,旧金山“Code with Claude”开发者大会上,Anthropic CEO Dario Amodei 和 总裁 Daniela Amodei 兄妹二人同台对话。主持人 Ami Vora 是 Anthropic 的首席产品官,曾任职于微软、Meta。
2026年4月,Khan TED Institute正式进入公众视野。该项目计划以约一万美元的成本,探索一种面向AI时代的新型高等教育路径,并邀请谷歌、微软、麦肯锡等全球知名企业共同参与课程与能力体系设计,试图将教育与未来真实工作世界更紧密地连接起来。
今天凌晨,Claude 官方宣布正式接入微软 Excel、PowerPoint 和 Word,并在 Outlook 中开放了公测版。无论你在微软的哪个应用中使用 Claude,它都能记住你之前的完整对话内容,跨应用操作更加顺畅。
在对多位内部开发者的采访中得知,这个模型的研发已被叫停。LPM 1.0 并非仍在推进的核心项目,而是视频团队对过去一年工作成果的集中汇报——既是对外展示,也是对内总结。该视频团队由“童姥”( 前微软亚研院首席研究员童欣) 带领, AilingZeng做Tech Lead,作者中近半数来自 Anuttacon内部,蔡浩宇本人并未直接参与模型研发。
近日,美国五角大楼宣布与七家公司达成协议,包括 OpenAI、谷歌、微软、亚马逊、英伟达、SpaceX 和一家名为 Reflection AI 的初创公司,允许将这些公司的 AI 系统用于机密级别的军
谷歌母公司Alphabet营收达到1099亿美元,每股收益5.11美元,远超华尔街预期的2.62美元;亚马逊净销售额1815亿美元,净利润303亿美元,每股收益2.78美元,几乎是预期的两倍;微软营收829亿美元,同比增长18%;Meta净利润268亿美元,同比接近翻倍。
据The Verge等多家外媒报道,今天凌晨,埃隆·马斯克(Elon Musk)与OpenAI CEO萨姆·奥尔特曼(Sam Altman)的世纪庭审在加州奥克兰联邦法院进入开庭陈词阶段。当天,马斯克身穿黑色西装、系黑色领带,出现在联邦法院。马斯克方、OpenAI方与微软方依次发表开庭陈词,随后马斯克作为本案第一证人进行举证。