RLinf-USER重磅发布!别再用仿真了,真实世界训练也能「极致效率与系统化」
RLinf-USER重磅发布!别再用仿真了,真实世界训练也能「极致效率与系统化」首个统一系统:将物理机器人提升为与 GPU 同等的计算资源,打破硬件隔阂。
来自主题: AI技术研报
8330 点击 2026-02-11 14:00
首个统一系统:将物理机器人提升为与 GPU 同等的计算资源,打破硬件隔阂。
近年来,基于流匹配的 VLA 模型,特别是 Physical Intelligence 发布的 π0 和 π0.5,已经成为机器人领域备受关注的前沿技术路线。流匹配以极简方式建模多峰分布,能够生成高维且平滑的连续动作序列,在应对复杂操控任务时展现出显著优势。
清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf:首个面向具身智能的“渲训推一体化”大规模强化学习框架。