AI资讯新闻榜单内容搜索-o3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: o3
奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

刚刚,奥特曼接连抛出重磅消息:GPT-5不仅将免费开放,还将整合多项尖端技术。o3和o4-mini即将在几周内亮相,还有一个神秘的开源推理模型要来。然而,另一边Meta的Llama 4却因性能瓶颈屡次延期,AI竞赛的格局愈发扑朔迷离。

来自主题: AI资讯
8142 点击    2025-04-05 15:13
250多篇论文,上海AI Lab综述推理大模型高效思考

250多篇论文,上海AI Lab综述推理大模型高效思考

250多篇论文,上海AI Lab综述推理大模型高效思考

最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。

来自主题: AI技术研报
7313 点击    2025-04-05 14:45
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

AI社区掀起用大模型玩游戏之风!例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。

来自主题: AI技术研报
7811 点击    2025-03-29 10:19
OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击

OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击

OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击

「思维链劫持」(H-CoT)的攻击方法,成功攻破了包括OpenAI o1/o3、DeepSeek-R1等在内的多款大型推理模型的安全防线。研究表明,这些模型的安全审查过程透明化反而暴露了弱点,攻击者可以利用其内部推理过程绕过安全防线,使模型拒绝率从98%骤降2%。

来自主题: AI技术研报
6194 点击    2025-03-28 16:09
全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

AI界「智商大考」ARC-AGI-2重磅出炉了!一个人类用5分钟轻松解开的谜题,却让最顶尖LLM全线崩盘得分挂零,o3更是从曾经76%暴跌至4%。它正式宣告,人类还未实现AGI。

来自主题: AI技术研报
7051 点击    2025-03-25 17:53
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

本文介绍了当前最受科研人员青睐的AI模型,推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonnet和开源明星Olmo 2,它们各有优劣,为科研人员提供了多样选择。

来自主题: AI资讯
9048 点击    2025-03-25 11:53
谷歌大型推理模型曝光!击败Claude-3.7-Thinking

谷歌大型推理模型曝光!击败Claude-3.7-Thinking

谷歌大型推理模型曝光!击败Claude-3.7-Thinking

哎!最近推特上的网友在LMSYS Arena 发现了个泄漏的大模型 Nebula,效果据说特别好,打败了o1、o3mini、Claude3.7 Thinking等等模型:网友们通过询问和分析 API,发现这似乎是谷歌正在秘密演练的新推理模型!推测可能是 Google Gemini 2.0 Pro Thinking:

来自主题: AI资讯
7060 点击    2025-03-24 14:41