蛰伏一年,周衔团队带来首个具身基础模型,烹饪做实验弹琴,效果炸场
蛰伏一年,周衔团队带来首个具身基础模型,烹饪做实验弹琴,效果炸场那个一句话生成完整物理世界、做出 GitHub 最大开源机器人项目的团队,又出手了。
来自主题: AI技术研报
7447 点击 2026-05-07 17:02
搜索
那个一句话生成完整物理世界、做出 GitHub 最大开源机器人项目的团队,又出手了。
国内首个利用世界模型生成数据实现真机泛化的端到端VLA具身基础模型GigaBrain-0重磅发布。
为了构建鲁棒的 3D 机器人操纵大模型,Lift3D 系统性地增强 2D 大规模预训练模型的隐式和显式 3D 机器人表示,并对点云数据直接编码进行 3D 模仿学习。Lift3D 在多个仿真环境和真实场景中实现了 SOTA 的操纵效果,并验证了该方法的泛化性和可扩展性。
具身基础模型突破2D,全新生成式视觉-语言-行动模型3D-VLA,在多项任务中显著提高了推理、多模态生成和规划的能力。