
CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力在机器人操作任务中,预测性策略近年来在具身人工智能领域引起了广泛关注,因为它能够利用预测状态来提升机器人的操作性能。然而,让世界模型预测机器人与物体交互的精确未来状态仍然是一个公认的挑战,尤其是生成高质量的像素级表示。
在机器人操作任务中,预测性策略近年来在具身人工智能领域引起了广泛关注,因为它能够利用预测状态来提升机器人的操作性能。然而,让世界模型预测机器人与物体交互的精确未来状态仍然是一个公认的挑战,尤其是生成高质量的像素级表示。
GitHub变天了!今天起,它不再独立。它再也不是那个为开发者的自由而生的平台,而成了微软AI代理工厂的一部分。CEO宣布辞职,出走创业。终于,一个时代落幕了。
自 ChatGPT 引爆公众认知以来,AI 开始渗透进写作、编程、设计等多个应用场景,推动人类进入“智能体(Agent)”时代。曾经遥不可及的自动化交互,如今正在成为现实。在这背后,一场关于基础设施的重构也悄然展开——从模型能力到部署体验,谁能打通智能 Agent 的“最后一公里”,谁就掌握了这场范式变革的主动权。
红杉美国合伙人 Konstantine Buhler 预测 2025 年将成为 AI agent 的“群体协作”时代,标志着 Agent 元年的到来。
80分钟的一场活动,Agent的“出镜次数”竟能高达217次。 解锁平均20多秒就提一次Agent的,正是云计算一哥,亚马逊云科技。
今天早上在各种AI社群中很多人都在讨论一件事:OpenAI在macOS版ChatGPT桌面应用中推出了一项重磅功能——Record模式,现已全面开放给Plus用户。这意味着,用户可以通过语音直接与AI对话,并将音频实时转录、总结为结构化内容,彻底改变了我们记录会议、捕捉灵感和处理信息的方式。
剧本杀大家都玩过吗?这是一种经典的桌上角色扮演游戏(TTRPG), 游戏中的核心人物是游戏主持人(GM), 相当于整个世界的「导演 + 编剧 + 旁白」,负责掌控游戏环境,讲述故事背景,并扮演所有非玩家角色(NPC)。
大数据已经能闻出AI味儿了!最近,一份席卷生物医学圈的报告发出警告:如果你论文里高频出现delves、underscores等454个特定词汇,就要小心了——这很可能就是AI留下的「指纹」。
现实版的「一人得道」!AI云服务商CoreWeave上市3个月后,CEO赚麻了,直接跻身全球顶级富豪榜Top 500。暴富速度,史上第二!这轮涨势也带动了其他几位联合创始人「一夜暴富」:首席战略官Brian Venturo目前资产达64亿美元,首席开发官Brannin McBee的身家则为47亿美元。
在我们去年 AI Scaling Laws article from late last year中,我们探讨了多层 AI 扩展定律如何持续推动 AI 行业向前发展,使得模型能力的增长速度超过了摩尔定律,并且单位 token 成本也相应地迅速降低。