无需再训练微调,一个辅助系统让GPT-5.2准确率飙到创纪录的75%
无需再训练微调,一个辅助系统让GPT-5.2准确率飙到创纪录的75%什么?决定 AI 上限的已不再是底座模型,而是外围的「推理编排」(Orchestration)。
来自主题: AI资讯
7121 点击 2025-12-25 14:19
什么?决定 AI 上限的已不再是底座模型,而是外围的「推理编排」(Orchestration)。
6位前DeepMind成员以元系统重塑大模型调用方式,该系统推出的Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩夺得榜首,而成本仅为此前最优方法的一半。
AI界「智商大考」ARC-AGI-2重磅出炉了!一个人类用5分钟轻松解开的谜题,却让最顶尖LLM全线崩盘得分挂零,o3更是从曾经76%暴跌至4%。它正式宣告,人类还未实现AGI。