上海AI Lab新研究:SFT能泛化,只要满足这三个条件
上海AI Lab新研究:SFT能泛化,只要满足这三个条件随着大模型后训练(Post-training)技术的发展,强化学习(RL)在提升模型推理能力方面的表现备受瞩目。
搜索
随着大模型后训练(Post-training)技术的发展,强化学习(RL)在提升模型推理能力方面的表现备受瞩目。
这个生物医学视觉推理框架,被CVPR 2026接收了!
用13个月时间完成5轮融资,实现估值30倍暴涨。
让AI像Kaggle顶尖选手一样设计算法,需要几步?
本⽂的主要作者来⾃上海交通⼤学和上海⼈⼯智能实验室,核⼼贡献者包括任麒冰、郑志杰、郭嘉轩,指导⽼师为⻢利庄⽼师和邵婧⽼师,研究⽅向为安全可控⼤模型和智能体。 最近,Moltbook 的爆⽕与随后的迅速
腾讯持股20%,年销3.9万张AI加速卡及模组。
近日,北京浩瀚深度信息技术股份有限公司(以下简称“浩瀚深度”)与云边云科技(上海)有限公司(以下简称“云边云”)的股东签署了《股权/财产份额收购协议》,浩瀚深度及其子公司合肥浩瀚拟以8575万元收购云边云公司35%的股权。
上海AI Lab联合多家机构开源的Yume1.5,针对这一核心难题提出了时空信道联合建模(TSCM),在长视频生成中实现了近似恒定计算成本的全局记忆访问。
近日,上海人工智能实验室的研究团队提出了一种全新的后训练范式——RePro(Rectifying Process-level Reward)。这篇论文将推理的过程视为模型内部状态的优化过程,从而对如何重塑大模型的CoT提供了一个全新视角:
一页纯文本的记忆是看不清世界的。