AI资讯新闻榜单内容搜索-ARC-AGI-2

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: ARC-AGI-2

Gemini 3.1 Pro 曝光，能力翻倍价格不变，谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光，能力翻倍价格不变，谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光，能力翻倍价格不变，谷歌想重新定义 AI 竞争规则

当地时间 2 月 19 日，Google 曝光 Gemini 3.1 Pro 最新模型。在 ARC-AGI-2 这个公认的推理基准测试中，Gemini 3.1 Pro 拿到了 77.1% 的分数。什么概念？它的前辈 Gemini 3 Pro 只有 31.1%，就连专门用来「深度思考」的 Gemini 3 Deep Think 也只有 45.1%。

来自主题: AI资讯

9259 点击 2026-02-20 13:53

刚刚谷歌发布 Gemini 3.1 Pro

刚刚谷歌发布 Gemini 3.1 Pro

刚刚谷歌发布 Gemini 3.1 Pro

今天凌晨，Google 发布 Gemini 3.1 Pro。核心提升在推理能力，ARC-AGI-2（抽象推理基准）从 3 Pro 的 31.1% 跳到 77.1%，翻了一倍多，GPQA Diamond（科学知识推理）从 91.9% 提到 94.3%

来自主题: AI资讯

11108 点击 2026-02-20 02:47

GPT-5.2考赢人类！OpenAI警告：大模型能力已过剩，AGI天花板不是AI

GPT-5.2考赢人类！OpenAI警告：大模型能力已过剩，AGI天花板不是AI

GPT-5.2考赢人类！OpenAI警告：大模型能力已过剩，AGI天花板不是AI

刚刚，GPT-5.2刷新了一项新纪录！OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上，表现超过了人类基线水平。

来自主题: AI资讯

10999 点击 2026-01-11 10:10

无需再训练微调，一个辅助系统让GPT-5.2准确率飙到创纪录的75%

无需再训练微调，一个辅助系统让GPT-5.2准确率飙到创纪录的75%

无需再训练微调，一个辅助系统让GPT-5.2准确率飙到创纪录的75%

什么？决定 AI 上限的已不再是底座模型，而是外围的「推理编排」（Orchestration）。

来自主题: AI资讯

8287 点击 2025-12-25 14:19

6位前DeepMind老将打造「AI指挥官」，一半成本刷新SOTA

6位前DeepMind老将打造「AI指挥官」，一半成本刷新SOTA

6位前DeepMind老将打造「AI指挥官」，一半成本刷新SOTA

6位前DeepMind成员以元系统重塑大模型调用方式，该系统推出的Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩夺得榜首，而成本仅为此前最优方法的一半。

来自主题: AI技术研报

8906 点击 2025-12-15 11:31

全球顶级模型集体0分，AI终极大考人类5分钟秒杀！Keras之父戳破AGI神话

全球顶级模型集体0分，AI终极大考人类5分钟秒杀！Keras之父戳破AGI神话

全球顶级模型集体0分，AI终极大考人类5分钟秒杀！Keras之父戳破AGI神话

AI界「智商大考」ARC-AGI-2重磅出炉了！一个人类用5分钟轻松解开的谜题，却让最顶尖LLM全线崩盘得分挂零，o3更是从曾经76%暴跌至4%。它正式宣告，人类还未实现AGI。

来自主题: AI技术研报

9400 点击 2025-03-25 17:53

上一页当前第1页,共1页下一页