NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路
NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路大模型推理的爆发,实际源于 scaling 范式的转变:从 train-time scaling 到 test-time scaling(TTS),即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法:通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗?
来自主题: AI技术研报
7566 点击 2025-11-30 09:30