OMG多模态人形机器人运动生成框架:一句话、一段音乐即可操纵机器人完成全身动作
OMG多模态人形机器人运动生成框架:一句话、一段音乐即可操纵机器人完成全身动作现阶段大多数人形机器人的运动控制还局限于 “有参考才能动” 的被动跟踪模式。
搜索
现阶段大多数人形机器人的运动控制还局限于 “有参考才能动” 的被动跟踪模式。
人类在日常生活中协调全身来完成移动操作任务:打开垃圾桶时会踩下踏板,从低处拿东西时需要下蹲,推车时需要同步协调手臂抓握和腿部移动。对试图复刻人类能力的人形机器人来说,身体不应只是「手臂 + 移动平台」,而应是一个能协调手、腰、腿、脚共同完成任务的运动整体。
这篇来自 Interlatent(一家聚焦具身智能后训练与部署的早期创业公司) 的文章,试图从第一性原理出发,把现代 AI 机器人技术重新讲清楚:一个机器人到底如何理解世界,如何生成动作,又为什么会在数据、延迟和泛化上遇到如此多的困难。
当全球具身智能行业还在争论技术路线时,一家中国公司已经率先定义并跑通了自己的答案。深度机智提出的「人类学习」路线——以人类数据为起点、动作建模为中心、机器人为 AI 而生——正在被英伟达、Physical Intelligence 等海外头部机构沿同一方向跟进。
机器人已经学会看见世界,也开始学会摸到世界。但对于真实接触操作而言,仅仅感知当前状态远远不够,机器人还需要预测物理世界接下来会如何变化。擦拭、插接、拧紧,这些人类几乎凭感觉就能完成的动作,对机器人来说却并非易事:接触力度会变化,物体位置会偏移,反馈慢一步,就可能打滑、卡住或丢失。
大模型浪潮席卷全球数年,技术形态持续迭代,也开始从办公、编程领域,深度渗透到科研这一核心赛道。从中科大夯实数理根基,到哈佛、MIT 完成联合培养,青年学者陈勇超横跨力学、机器人、自然语言处理、大模型等多个领域,完整亲历 AI 一轮轮技术变革。
太硬核了!全球首个搭载AI大脑的防爆机器人,正式接管加油站。自主定位、拧盖、提枪、注油,全套动作行云流水,24小时无休作业,具身智能终于在高危场景一战封神。
近日,西班牙AI机器人公司 Theker 宣布完成7300万欧元(约合8500万美元)的A轮融资。这是欧洲机器人领域史上规模最大的A轮融资。时尚巨头Zara的母公司Inditex不仅是公司早期投资方,公司机器人已在Inditex的实际生产设施中运行。
公司由姚颂联合正大集团、清华青年学者于超共同发起,定位为物理智能系统公司,通过世界动作模型(WAM)与强化学习技术,推动机器人在真实商业与工业场景中落地,最终成为一个可信赖的机器人服务提供商。目前已完成近亿美元天使轮系列融资,投资方包括正大集团、华勤技术、九安医疗等多家上市企业,多位国内与国际知名企业家,以及多家一线投资机构。
美方官员被曝坦言,美国已流失下一代机器人配套产能。