AI资讯新闻榜单内容搜索-CoT

DeepMind率先提出CoF：视频模型有自己的思维链

CoT思维链的下一步是什么？ DeepMind提出帧链CoF（chain-of-frames）。

来自主题: AI技术研报

7539 点击 2025-09-28 18:04

攻克AI过度思考难题！美团新研究让通过“可验证”过程奖励激活LRM的高效推理

LRM通过简单却有效的RLVR范式，培养了强大的CoT推理能力，但伴随而来的冗长的输出内容，不仅显著增加推理开销，还会影响服务的吞吐量，这种消磨用户耐心的现象被称为“过度思考”问题。

来自主题: AI技术研报

10600 点击 2025-09-12 10:47

隐式推理，继CoT思维链之后，LLM的下一个技术奇点系统性综述来了｜港科大最新

您对“思维链”（Chain-of-Thought）肯定不陌生，从最早的GPT-o1到后来震惊世界的Deepseek-R1，它通过让模型输出详细的思考步骤，确实解决了许多复杂的推理问题。但您肯定也为它那冗长的输出、高昂的API费用和感人的延迟头疼过，这些在产品落地时都是实实在在的阻碍。

来自主题: AI技术研报

10883 点击 2025-09-05 10:22

告别无效计算！新TTS框架拯救19%被埋没答案，推理准确率飙升

大语言模型通过 CoT 已具备强大的数学推理能力，而 Beam Search、DVTS 等测试时扩展（Test-Time Scaling, TTS）方法可通过分配额外计算资源进一步提升准确性。然而，现有方法存在两大关键缺陷：路径同质化（推理路径趋同）和中间结果利用不足（大量高质量推理分支被丢弃）。

来自主题: AI技术研报

9658 点击 2025-09-03 12:03

链式思维是幻象吗？从数据分布视角重新审视大模型推理，马斯克回复，Grok破防

思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段，通过在输入中加入「Let’s think step by step」等提示，模型会生成类似人类的中间推理步骤，显著提升复杂任务的表现。然而，这些流畅的推理链条是否真的反映了模型的推理能力？

来自主题: AI技术研报

7640 点击 2025-08-15 12:38

多模态后训练反常识：长思维链SFT和RL的协同困境

在语言模型领域，长思维链监督微调（Long-CoT SFT）与强化学习（RL）的组合堪称黄金搭档 —— 先让模型学习思考模式，再用奖励机制优化输出，性能通常能实现叠加提升。

来自主题: AI技术研报

8696 点击 2025-08-02 12:49

ICML 2025 | CoTo：让LoRA训练「渐入佳境」，模型融合、剪枝样样精通

还在为 LoRA 训练不稳定、模型融合效果差、剪枝后性能大降而烦恼吗？来自香港城市大学、南方科技大学、浙江大学等机构的研究者们提出了一种简单的渐进式训练策略，CoTo，通过在训练早期随机失活一部分适配器，并逐渐提高其激活概率，有效缓解了层级不均衡问题，并显著增强了模型在多任务融合和剪枝等操作上的鲁棒性和有效性。该工作已被机器学习顶会 ICML 2025 接收。

来自主题: AI技术研报

7966 点击 2025-07-27 13:12