AI资讯新闻榜单内容搜索-推理模型

语音界Deepseek！百度最新跨模态端到端语音交互，成本最高降90%

没想到，文小言接入推理模型的大更新背后，百度还藏了一手“质变”级技术大招？？？

来自主题: AI技术研报

9336 点击 2025-04-03 09:55

OpenAI要Open了！奥特曼开源首个推理模型，ChatGPT一小时暴增百万用户

OpenAI真的要开源了！奥特曼官宣，即将开源自GPT-2以来的首款推理模型，可在消费级硬件上运行。同时，OpenAI又拿到了最高400亿单轮融资，估值直冲3000亿。

来自主题: AI资讯

9661 点击 2025-04-01 10:40

OpenAI重新开源！第一弹就推理模型，还不限制商用，“冲着DeepSeek来的”

一夜之间，OpenAI更新三大动向，开源、融资、用户暴增。第一，将开源一个具备推理能力的大语言模型，包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

来自主题: AI资讯

10903 点击 2025-04-01 09:15

200美金，人人可手搓QwQ，清华、蚂蚁开源极速RL框架AReaL-boba

由于 DeepSeek R1 和 OpenAI o1 等推理模型（LRM，Large Reasoning Model）带来了新的 post-training scaling law，强化学习（RL，Reinforcement Learning）成为了大语言模型能力提升的新引擎。然而，针对大语言模型的大规模强化学习训练门槛一直很高：

来自主题: AI技术研报

11861 点击 2025-03-31 15:07

AI大模型看手相！图片视频加持深度思考，阿里QVQ-Max“神了神了”

阿里又发了个有意思的大模型——QVQ-Max，第一版视觉推理模型，对任意图像或视频都可以进行深度思考。

来自主题: AI资讯

8749 点击 2025-03-28 17:01

OpenAI破大防，拒绝率从98%骤降2%！陈怡然团队提出全新思维链劫持攻击

「思维链劫持」（H-CoT）的攻击方法，成功攻破了包括OpenAI o1/o3、DeepSeek-R1等在内的多款大型推理模型的安全防线。研究表明，这些模型的安全审查过程透明化反而暴露了弱点，攻击者可以利用其内部推理过程绕过安全防线，使模型拒绝率从98%骤降2%。

来自主题: AI技术研报

8305 点击 2025-03-28 16:09

实测豆包刚刚上线的新版深度思考，他们也向DeepSearch迈出了一步。

今天晚上，就在刚刚，豆包终于上了之前很多人期待的功能，深度思考。我之前用别人的账号体验过这功能，就是推理模型，而今天看到的第一刻，我以为的是，豆包的推理模型终于全量上线了。

来自主题: AI资讯

10673 点击 2025-03-27 21:28

DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场，支持原生多模态，但依然败给了“竹竿问题”

又双叒，抢在OpenAI直播之前，谷歌Gemini 2.5系列来了。首个版本Pro Experimental一登场就抢下大模型竞技场第一名，并且整整比GPT-4.5高出40分Gemini 2.5同样是推理模型，用Jeff Dean的说法是：

来自主题: AI资讯

9450 点击 2025-03-26 08:40

DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

DeepSeek V3升级了，新版本V3-0324。

来自主题: AI资讯

4863 点击 2025-03-25 10:41

谷歌大型推理模型曝光！击败Claude-3.7-Thinking

哎！最近推特上的网友在LMSYS Arena 发现了个泄漏的大模型 Nebula，效果据说特别好，打败了o1、o3mini、Claude3.7 Thinking等等模型：网友们通过询问和分析 API，发现这似乎是谷歌正在秘密演练的新推理模型！推测可能是 Google Gemini 2.0 Pro Thinking：

来自主题: AI资讯

9411 点击 2025-03-24 14:41