AI资讯新闻榜单内容搜索-思维链

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 思维链

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

关注NLP领域的人们，一定好奇「语言模型能做什么？」「什么是o1？」「为什么思维链有效？」

来自主题: AI技术研报

5981 点击 2025-02-04 20:15

DeepSeek-R1 是怎么训练的｜深度拆解

DeepSeek-R1 是怎么训练的｜深度拆解

DeepSeek-R1 是怎么训练的｜深度拆解

昨天晚上，DeepSeek 又开源了 DeepSeek-R1 模型（后简称 R1），再次炸翻了中美互联网： R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API，对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版，小模型则超越 OpenAI o1-mini

来自主题: AI技术研报

19185 点击 2025-01-21 13:15

思维链？思维树？华为诺亚：现在到了思维森林时刻！

思维链？思维树？华为诺亚：现在到了思维森林时刻！

思维链？思维树？华为诺亚：现在到了思维森林时刻！

OpenAI 接连发布 o1 和 o3 模型，大模型的高阶推理能力正在迎来爆发式增强。在预训练 Scaling law “撞墙” 的背景下，探寻新的 Scaling law 成为业界关注的热点。高阶推理能力有望开启新的 Scaling law，为大模型的发展注入新的活力。

来自主题: AI技术研报

6751 点击 2025-01-14 14:43

迈向System 2推理，100页论文硬核讲述Meta-CoT

迈向System 2推理，100页论文硬核讲述Meta-CoT

迈向System 2推理，100页论文硬核讲述Meta-CoT

Meta-CoT 通过显式建模生成特定思维链（CoT）所需的底层推理过程，扩展了传统的思维链方法。

来自主题: AI资讯

6584 点击 2025-01-12 10:08

o1也会「想太多」？腾讯AI Lab与上海交大揭秘o1模型过度思考问题

o1也会「想太多」？腾讯AI Lab与上海交大揭秘o1模型过度思考问题

o1也会「想太多」？腾讯AI Lab与上海交大揭秘o1模型过度思考问题

本文将介绍首个关于 o1 类长思维链模型过度思考现象。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。

来自主题: AI技术研报

7556 点击 2025-01-08 14:34

Just keep scaling！思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

Just keep scaling！思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

Just keep scaling！思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

2023 年初，Jason Wei 加入了 OpenAI，参与了 ChatGPT 的构建以及 o1 等重大项目。他的工作使思维链提示、指令微调和涌现现象等技术和概念变得广为人知。

来自主题: AI资讯

6162 点击 2025-01-04 14:32

引入长思维链！微信基于阿里千问大模型搞出个翻译版o1

引入长思维链！微信基于阿里千问大模型搞出个翻译版o1

引入长思维链！微信基于阿里千问大模型搞出个翻译版o1

最近，类 o1 模型的出现，验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考（long thought）的帮助下，LLM 倾向于探索、反思和自我改进推理过程，以获得更准确的答案。

来自主题: AI技术研报

7338 点击 2024-12-27 10:03

压缩思维链CCoT：一种突破性的高效AI推理新范式

压缩思维链CCoT：一种突破性的高效AI推理新范式

压缩思维链CCoT：一种突破性的高效AI推理新范式

在大语言模型（LLM）的发展历程中，思维链（Chain of Thought，CoT）推理无疑是一个重要的里程碑。

来自主题: AI技术研报

8094 点击 2024-12-24 09:51

全面超越CoT！Meta田渊栋团队新作：连续思维链

全面超越CoT！Meta田渊栋团队新作：连续思维链

全面超越CoT！Meta田渊栋团队新作：连续思维链

针对大语言模型的推理任务，近日，Meta田渊栋团队提出了一个新的范式：连续思维链，对比传统的CoT，性能更强，效率更高。

来自主题: AI技术研报

7481 点击 2024-12-19 13:33

多智能体架构Insight-V来了！突破长链视觉推理瓶颈

多智能体架构Insight-V来了！突破长链视觉推理瓶颈

多智能体架构Insight-V来了！突破长链视觉推理瓶颈

大语言模型（LLMs）通过更多的推理展现出了更强的能力和可靠性，从思维链提示发展到了 OpenAI-o1 这样具有较强推理能力的模型。

来自主题: AI技术研报

5825 点击 2024-12-13 14:40

上一页当前第7页,共11页下一页