AI资讯新闻榜单内容搜索-o3-pro

o3-pro通关“推箱子”，人类怀旧小游戏成了大模型新Benchmark

推箱子、俄罗斯方块……这些人类的经典怀旧小游戏，也成大模型benchmark了。 o3-pro刚刚也挑战了这两款游戏，而且表现还都不错，直接突破了benchmark上限

来自主题: AI技术研报

11008 点击 2025-06-16 17:26

最强推理模型一夜易主！深夜，o3-pro毫无预警上线，刷爆数学、编程、科学基准，强势碾压o1-pro和o3。更惊艳的是，o3价格直接暴降80%，叫板Gemini 2.5 Pro。

来自主题: AI技术研报

8702 点击 2025-06-11 13:20

OpenAI深夜放大招，正式推出“最新最强版”推理模型o3-pro！而且同一时间，o3模型降价80%不降智。官方测评结果显示，在专家评估中，所有人一致更偏爱o3-pro而非o3的回答。

来自主题: AI资讯

10942 点击 2025-06-11 10:50