AI资讯新闻榜单内容搜索-思维链

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 思维链
TypedThinker框架,多维度推理Prompt让LLM推理更精准,卡梅隆和Qwen团队最新

TypedThinker框架,多维度推理Prompt让LLM推理更精准,卡梅隆和Qwen团队最新

TypedThinker框架,多维度推理Prompt让LLM推理更精准,卡梅隆和Qwen团队最新

大语言模型(LLMs)在推理任务上展现出了令人瞩目的能力,但其推理思维方式的单一性一直是制约性能提升的关键瓶颈。目前的研究主要关注如何通过思维链(Chain-of-Thought)等方法来提升推理的质量,却忽视了一个重要维度——推理类型的多样性。

来自主题: AI技术研报
7789 点击    2024-12-11 10:16
DeepSeek 推理模型预览版上线,解密 o1 推理过程

DeepSeek 推理模型预览版上线,解密 o1 推理过程

DeepSeek 推理模型预览版上线,解密 o1 推理过程

今天,DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。所有用户均可登录官方网页 (chat.deepseek.com),一键开启与 R1-Lite 预览版模型的超强推理对话体验。DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。

来自主题: AI资讯
10037 点击    2024-11-20 23:11
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等出品,首个多模态版o1开源模型来了—— 代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。 在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。

来自主题: AI技术研报
5308 点击    2024-11-19 21:01
17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。

17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。

17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。

这两天,我被这个Claude3.5这个神级Prompt惊呆了。 佩服的五体投地。 非常简单的话说,就是它用Prompt把o1级别的思维链,复刻到了Claude3.5里,而且思考逻辑更详细、更像人,甚至思考过程都跟o1一样,可以展开折叠。

来自主题: AI资讯
7162 点击    2024-11-15 20:28
深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

研究人员通过案例研究,利用大型语言模型(LLMs)如GPT-4、Claude 3和Llama 3.1,探索了思维链(CoT)提示在解码移位密码任务中的表现;CoT提示虽然提升了模型的推理能力,但这种能力并非纯粹的符号推理,而是结合了记忆和概率推理的复杂过程。

来自主题: AI技术研报
3270 点击    2024-11-13 09:07
NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

该文章的第一作者陈麒光,目前就读于哈工大赛尔实验室。他的主要研究方向包括大模型思维链、跨语言大模型等。 该研究主要提出了推理边界框架(Reasoning Boundary Framework, RBF),首次尝试量化并优化思维链推理能力。

来自主题: AI技术研报
3516 点击    2024-11-10 13:50
这个 AI 伴侣连脑回路都能看到了,体验有什么不一样

这个 AI 伴侣连脑回路都能看到了,体验有什么不一样

这个 AI 伴侣连脑回路都能看到了,体验有什么不一样

自从 OpenAI 把模型升级,整合了思维链进去之后,整个 AI 界仿佛……仿佛无事发生。

来自主题: AI资讯
4319 点击    2024-10-26 11:23