视频生成太慢?英伟达、谢赛宁等发布TMD框架,实现70倍加速
视频生成太慢?英伟达、谢赛宁等发布TMD框架,实现70倍加速近年来,大规模视频扩散模型在视频生成领域取得了显著进展。然而,采样效率低下仍然是这类模型的核心瓶颈。
近年来,大规模视频扩散模型在视频生成领域取得了显著进展。然而,采样效率低下仍然是这类模型的核心瓶颈。
微信,终于不再躺平了。 就在刚刚,据 The Information 独家爆料,腾讯正在打造一款「绝密级」AI 智能体,直接内嵌进微信,能够帮你打车、买菜、订机票、全程代劳的「真·生活管家」。 这也意味着,14 亿月活用户即将拥有一个能动手绝不动口的超级助理。
3月6日,腾讯混元发布了一篇名为“HY-WU (Part I): An Extensible Functional Neural Memory Framework and An Instantiation in Text-Guided Image Editing”的技术报告。提出了一种崭新的功能性记忆(functional neural memory)范式(weight unleashing),
今日凌晨,Cursor宣布推出类OpenClaw功能——Cursor Automations,让AI 7×24小时自动帮开发者审核、监控、修复代码,还能辅助研发流程。基于这一功能,开发者只需配置Agent,让它们持续监控并优化代码库,就能打造出真正自动化的“软件研发工厂”。并且,所有的这些自动化能力都由云端Agent驱动,它们会使用自己的算力去构建、测试和演示工作成果。
在 50 亿美元估值神话的背后,这一空间智能的最新高地正被国内创业公司攻克并推向产业纵深。近日,影溯(InSpatio)正式发布并开源了其实时帧生成模型 InSpatio-WorldFM,一个实时交互的 3D 世界模型。这标志着中国团队在空间智能底层技术上取得了奠基性突破,而且以开放的姿态,正成为推动 AI 从虚拟屏幕走向物理现实的关键破局者。
长期以来,计算机视觉领域陷入了一个 “表征(Representation)” 的执念。我们习惯设计各种精巧的 Encoder,试图将动态世界压缩成一组特征向量。然而,视频作为现实的高维投影,其熵值之高、动态之复杂,让这种试图 “定格” 的表征显得力不从心。
香港科技大学 PEI-Lab 与字节跳动 Seed 团队近期提出的 WMPO(World Model-based Policy Optimization),正是这样一种让具身智能在 “想象中训练” 的新范式。该方法无需在真实机器人上进行大规模强化学习交互,却能显著提升策略性能,甚至涌现出 自我纠错(Self-correction) 行为。
这家成立两年的初创公司周四表示,已完成900 万美元种子轮融资,由 Susquehanna International Group(SIG)和光速创投领投,B Capital、Seaborne Capital、Beenext、Sparrow Capital 和 2.2 Capital 跟投。
刚刚,毕业清华大学数学系,曾在Meta FAIR工作3.75年、主导过SAM与Llama多项核心工作的研究员张鹏川(Pengchuan Zhang)宣布离职。他的下一站,是来到OpenAI,投身于世界模拟与机器人学(World Simulation and Robotics)方向的研究。
春节前,千寻完成近 20 亿元人民币两轮融资,估值突破 100 亿元,新股东包括云锋基金、混沌投资、红杉中国等财务机构,Synstellation Capital、TCL 创投、明荟投资(汇川技术董事长家办)等产投方,重庆产业投资母基金、杭州金投等国资;顺为、Prosperity7、达晨财智等老股东也继续投资。