AI资讯新闻榜单内容搜索-推理模型

AI进入推理模型时代，一文带你读懂思维链

近段时间，推理模型 DeepSeek R1 可说是 AI 领域的头号话题。用过的都知道，该模型在输出最终回答之前，会先输出一段思维链内容。这样做可以提升最终答案的准确性。

来自主题: AI技术研报

8806 点击 2025-03-16 14:53

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

大语言模型（LLM）近年来凭借训练时扩展（train-time scaling）取得了显著性能提升。然而，随着模型规模和数据量的瓶颈显现，测试时扩展（test-time scaling）成为进一步释放潜力的新方向。

来自主题: AI技术研报

7798 点击 2025-03-16 12:42

“谷歌版DeepSeek”接入机器人，思维链解锁折纸系鞋带技能，推理模型代入物理世界

谷歌把推理大模型带入物理世界，机器人可以一边思考一边动作了!

来自主题: AI资讯

5589 点击 2025-03-13 15:30

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新架构

不怕推理模型简单问题过度思考了，能动态调整CoT的新推理范式SCoT来了！

来自主题: AI技术研报

7644 点击 2025-03-13 14:58

Claude 3.7 核心提示词曝光｜最懂提示词的大模型公司，现在怎么写 Prompt？

Anthropic 昨晚发布了他们最新的 Claude 3.7 Sonnet 混合推理模型，并在官网同步更新了 Claude 3.7 的系统提示词。

来自主题: AI技术研报

5288 点击 2025-03-13 11:54

OpenAI最强模型惨遭剖脑，CoT写下作弊自白书！不写代码耍心机被当场抓包

如今的前沿推理模型，学会出来的作弊手段可谓五花八门，比如放弃认真写代码，开始费劲心思钻系统漏洞！为此，OpenAI研究者开启了「CoT监控」大法，让它的小伎俩被其他模型戳穿。然而可怕的是，这个方法虽好，却让模型变得更狡猾了……

来自主题: AI技术研报

8685 点击 2025-03-12 09:23

阿里国际站AI布局引多家外媒关注：AI搜索Accio企业用户超百万

日前，阿里国际站总裁张阔在接受《南华早报》等多家外媒专访时透露，面向海外买家推出的AI搜索引擎Accio企业用户已超百万。2月，阿里国际站的全线AI产品相继接入Qwen2.5、DeepSeek等先进推理模型，尤其是原生AI应用Accio的推出，让阿里国际站的AI应用引发全球高度关注。

来自主题: AI资讯

9274 点击 2025-03-11 23:46

OpenAI自曝“o4”训练中，用思维链监控抓住AI作弊瞬间

o1/o3这样的推理模型太强大，一有机会就会利用漏洞作弊，怎么办？

来自主题: AI资讯

5812 点击 2025-03-11 16:35

Github超2万星，OpenManus核心作者聊Agent发展趋势

随着推理模型能力提升，本周Agent也进入刷屏周。

来自主题: AI资讯

7763 点击 2025-03-11 11:03

攻破OpenAI o1/o3、DeepSeek R1防线，安全推理过程反成大模型「阿喀琉斯之踵」

杜克大学计算进化智能中心的最新研究给出了警示性答案。团队提出的 H-CoT（思维链劫持）的攻击方法成功突破包括 OpenAI o1/o3、DeepSeek-R1、Gemini 2.0 Flash Thinking 在内的多款高性能大型推理模型的安全防线：在涉及极端犯罪策略的虚拟教育场景测试中，模型拒绝率从初始的 98% 暴跌至 2% 以下，部分案例中甚至出现从「谨慎劝阻」到「主动献策」的立场反转。

来自主题: AI技术研报

5757 点击 2025-03-09 10:37