AI资讯新闻榜单内容搜索-o1

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

一个新框架，让Qwen版o1成绩暴涨：在博士级别的科学问答、数学、代码能力的11项评测中，能力显著提升，拿下10个第一！这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。

来自主题: AI技术研报

6311 点击 2025-01-18 15:00

对于 LLM，推理时 scaling 是有效的！这一点已经被近期的许多推理大模型证明：o1、o3、DeepSeek R1、QwQ、Step Reasoner mini……

来自主题: AI技术研报

7459 点击 2025-01-18 14:39

这是阶跃星辰 Step 系列模型家族的首个推理模型。类似 OpenAI o1 的推理模型在国内终于卷起来了。

来自主题: AI资讯

6042 点击 2025-01-17 10:01

唯一一个在全国产算力上训练的深度推理模型来了！今天，讯飞星火深度推理大模型X1发布，发布会上现场摇数学题开做，答案全部正确。强强pk全国产胜，中文数学能力远超国内外「o1」级推理模型？

来自主题: AI资讯

10425 点击 2025-01-16 11:10

让我们说中文！ OpenAI o1 在推理时有个特点，就像有人考试会把关键解题步骤写在演草纸上，它会把推理时的内心 os 分点列出来。然而，最近 o1 的内心 os 是越来越不对劲了，明明是用英语提问的，但 o1 开始在演草纸上用中文「碎碎念」了。

来自主题: AI资讯

7560 点击 2025-01-16 10:17

OpenAI 接连发布 o1 和 o3 模型，大模型的高阶推理能力正在迎来爆发式增强。在预训练 Scaling law “撞墙” 的背景下，探寻新的 Scaling law 成为业界关注的热点。高阶推理能力有望开启新的 Scaling law，为大模型的发展注入新的活力。

来自主题: AI技术研报

6752 点击 2025-01-14 14:43

苹果&SpaceX前工程师分享o1使用心得，奥特曼、Brockman都转发了。

来自主题: AI资讯

7449 点击 2025-01-13 13:57

450 美元的价格，乍一听起来不算「小数目」。但如果，这是一个 32B 推理模型的全部训练成本呢？

来自主题: AI资讯

6656 点击 2025-01-12 17:08

大模型长序列的处理能力已越来越重要，像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式，需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。

来自主题: AI技术研报

7424 点击 2025-01-11 13:45

OpenAI o1 给大模型规模扩展 vs 性能的曲线带来了一次上翘。它在大模型领域重现了当年 AlphaGo 强化学习的成功 —— 给越多算力，就输出越多智能，一直到超越人类水平。

来自主题: AI技术研报

6334 点击 2025-01-11 11:22