你的AI助手更万能了!天禧合作字节扣子,解锁无限新功能
你的AI助手更万能了!天禧合作字节扣子,解锁无限新功能天禧个人超级智能体和字节跳动扣子官宣生态合作!
天禧个人超级智能体和字节跳动扣子官宣生态合作!
云栖大会上,阿里宣布AI平台将把完整的英伟达Physical AI(物理AI)软件栈纳入其开发者选项菜单。这个看似技术性的宣布,实际上标志着人工智能发展的一个重要转折点。英伟达CEO黄仁勋在2025年CES大会上明确表示:AI下一个前沿就是物理AI,蕴藏着巨大的潜力和机遇。
LightVLA 是一个旨在提升 VLA 推理效率且同时提升性能的视觉 token 剪枝框架。当前 VLA 模型在具身智能领域仍面临推理代价大而无法大规模部署的问题,然而大多数免训练剪枝框架依赖于中间注意力输出,并且会面临性能与效率的权衡问题。
不牺牲任何生成质量,将多模态大模型推理最高加速3.2倍! 华为诺亚方舟实验室最新研究已入选NeurIPS 2025。
视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等。
TC-Light 是由中科院自动化所张兆翔教授团队研发的生成式渲染器,能够对具身训练任务中复杂和剧烈运动的长视频序列进行逼真的光照与纹理重渲染,同时具备良好的时序一致性和低计算成本开销,使得它能够帮助减少 Sim2Real Gap 以及实现 Real2Real 的数据增强,帮助获得具身智能训练所需的海量高质量数据。
在三维重建、NeRF 训练、视频生成等任务中,相机参数是不可或缺的先验信息。传统的 SfM/SLAM 方法(如 COLMAP)在静态场景下表现优异,但在存在人车运动、物体遮挡的动态场景中往往力不从心,并且依赖额外的运动掩码、深度或点云信息,使用门槛较高,而且效率低下。
AI读不懂HTML、Markdown长文档的标题和结构,找信息总踩坑?解决方案来了——SEAL全新对比学习框架通过带结构感知+元素对齐,让模型更懂长文。
Kimi发布全新Agent模型OK Computer !这个新Agent名字好像还有点儿来头啊……别的先不说,OK Computer到底OK不OK?实测一下!
《Critterz》讲述了一群森林生物在村庄受到一个陌生人打扰后踏上冒险之旅的故事,该片是OpenAI创意专家Chad Nelson的创意。2023年,导演兼编剧Chad Nelson与Native Foreign团队完成了《Critterz》短片,并尝试首次使用OpenAI的DALL-E完成美术与场景风格设定。