AI资讯新闻榜单内容搜索-模型训练

RLHF与RLVR全都要，陈丹琦团队最新力作将推理能力拓展到通用智能

一个月前，我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines Lab 的消息。有些爆料认为她在休假一年后，会离开普林斯顿，全职加入 Thinking Machines Lab。

来自主题: AI技术研报

5746 点击 2025-09-28 16:46

翁荔陈丹琦加盟的840亿AI公司，公开第二篇论文

明星创业公司Thinking Machines，第二篇研究论文热乎出炉！公司创始人、OpenAI前CTO Mira Murati依旧亲自站台，翁荔等一众大佬也纷纷转发支持：论文主题为“Modular Manifolds”，通过让整个网络的不同层/模块在统一框架下进行约束和优化，来提升训练的稳定性和效率。

来自主题: AI技术研报

8026 点击 2025-09-28 09:54

免训练加速61倍！陈怡然团队新作DPad：仅关注「彩票token」

杜克大学团队发现，扩散大语言模型只需关注少量「中奖」token，就能在推理时把速度提升61-97倍，还能让模型更懂格式、更听话。新策略DPad不训练也能零成本挑出关键信息，实现「少算多准」的双赢。

来自主题: AI技术研报

6598 点击 2025-09-28 09:51

估值840亿AI实验室再放大招，他们要给大模型戴上「紧箍咒」

在大模型训练时，如何管理权重、避免数值爆炸与丢失？Thinking Machines Lab 的新研究「模块流形」提出了一种新范式，它将传统「救火式」的数值修正，转变为「预防式」的约束优化，为更好地训练大模型提供了全新思路。

来自主题: AI资讯

7724 点击 2025-09-27 16:10

业界首个高质量原生3D组件生成模型来了！来自腾讯混元团队

业界首个高质量原生3D组件生成模型来了！来自腾讯混元3D团队。现有的3D生成算法通常会生成一体化的3D模型，而下游应用通常需要语义可分解的3D形状，即3D物体的每一个组件需要单独地生成出来。

来自主题: AI技术研报

6949 点击 2025-09-27 16:06

超越免训练剪枝：LightVLA引入可微分token剪枝，首次实现VLA模型性能和效率的双重突破

LightVLA 是一个旨在提升 VLA 推理效率且同时提升性能的视觉 token 剪枝框架。当前 VLA 模型在具身智能领域仍面临推理代价大而无法大规模部署的问题，然而大多数免训练剪枝框架依赖于中间注意力输出，并且会面临性能与效率的权衡问题。

来自主题: AI技术研报

5196 点击 2025-09-27 11:25

多模态推理最高加速3.2倍！华为诺亚新算法入选NeurIPS 2025

不牺牲任何生成质量，将多模态大模型推理最高加速3.2倍！华为诺亚方舟实验室最新研究已入选NeurIPS 2025。

来自主题: AI技术研报

6552 点击 2025-09-27 11:19

缺数据也能拿SOTA？清华&上海AI Lab破解机器人RL两大瓶颈

视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。然而，现有训练范式存在一些核心瓶颈，比如数据采集成本高、泛化能力不足等。

来自主题: AI技术研报

6884 点击 2025-09-27 11:13

NeurIPS 2025 | 面向具身场景的生成式渲染器TC-Light来了，代码已开源

TC-Light 是由中科院自动化所张兆翔教授团队研发的生成式渲染器，能够对具身训练任务中复杂和剧烈运动的长视频序列进行逼真的光照与纹理重渲染，同时具备良好的时序一致性和低计算成本开销，使得它能够帮助减少 Sim2Real Gap 以及实现 Real2Real 的数据增强，帮助获得具身智能训练所需的海量高质量数据。

来自主题: AI技术研报

6241 点击 2025-09-27 11:06

NeurIPS Spotlight｜运动遮挡都不怕，0先验、一段视频精准预测相机参数

在三维重建、NeRF 训练、视频生成等任务中，相机参数是不可或缺的先验信息。传统的 SfM/SLAM 方法（如 COLMAP）在静态场景下表现优异，但在存在人车运动、物体遮挡的动态场景中往往力不从心，并且依赖额外的运动掩码、深度或点云信息，使用门槛较高，而且效率低下。

来自主题: AI技术研报

5854 点击 2025-09-27 10:58