AI资讯新闻榜单内容搜索-GPT-5.5

Hermes上线MoA功能！比Opus 4.8和GPT-5.5还猛

近日，Hermes Agent上线了MoA（Mixture of Agents）功能，支持用户自由组合多种模型作为虚拟模型使用，在Nous Research即将发布的基准测试中，这个混合模型的评分超过了Opus 4.8 和GPT-5.5。

来自主题: AI资讯

9019 点击 2026-07-01 00:22

GPT-5.6 偷偷灰度？有人在 Codex 里提前用上了

你以为自己在用GPT-5.5，但OpenAI可能已经在后台，悄悄把你的底层模型换成了更先进的GPT-5.6 Sol。

来自主题: AI技术研报

8564 点击 2026-06-29 16:14

刚刚，姚班传奇陈立杰苦思7年的计算几何核心难题，被ChatGPT推翻了

GPT-5.5 Pro 生成了一个数学证明，解决了计算几何中一个陈立杰苦思 7 年未解的核心难题。关键技术来自 OpenAI 上月的另一项突破，而最初推进这个问题的陈立杰发现，钥匙竟是自己参与的工作。

来自主题: AI资讯

5548 点击 2026-06-29 15:57

OpenAI又动了数亿人的默认模型，新版GPT-5.5 Instant正式上线

OpenAI又动了那个数亿人每天都在默认使用的模型。新版GPT-5.5 Instant正式上线，并向付费用户推出，第二天轮到免费用户。OpenAI总裁Greg Brockman发帖亲推：这一版有了重大改进，聊起来更有意思了。

来自主题: AI资讯

8568 点击 2026-06-27 11:31

横扫八大数学竞赛：清华微软联合提出STAR-PólyaMath，Apex基准超GPT-5.5 13.5%

被一道数学竞赛题卡住很久时，高手往往能准确地判断：现在缺的是一个技术细节，还是整个思路从一开始就走错了？

来自主题: AI技术研报

9472 点击 2026-06-25 10:04

尴尬了！OpenAI刚派GPT-5.5-Cyber修补地球，Codex却爆出致命bug

今天，OpenAI祭出满血GPT-5.5-Cyber，要给全世界的开源代码修漏洞。结果话音刚落，Codex被扒出史诗级bug：一年狂写640TB，能把SSD直接写废。

来自主题: AI资讯

8327 点击 2026-06-23 10:38

刚刚，OpenAI 放出满血版 GPT-5.5-Cyber！剑指 Claude Mythos 5

就在刚刚，OpenAI 直接放出了满血版 GPT-5.5-Cyber。CyberGym 安全评测排行榜，GPT-5.5-Cyber 得分 85.6%，单模型最高分。Claude Mythos 5 第二，83.8%。Claude Opus 4.7 排末尾，73.1%。

来自主题: AI资讯

9325 点击 2026-06-23 09:09

PaddleOCR：82k+ Stars的国产OCR天花板，0.9B小模型精度反超GPT-5.5

大模型再强，也读不懂你公司那一柜子的合同、发票和扫描件。在"纸张世界"和"LLM世界"之间，缺一座桥——而百度开源的 PaddleOCR，可能就是当下最稳的那座。

来自主题: AI技术研报

7276 点击 2026-06-17 10:32

离谱，AI 圈都在疯转一只不存在的「法国胖猫」

离谱了。这两天，AI 圈都在疯传一个叫 Le Chaton Fat 的新模型。 30T MoE、256 个专家、100 万上下文窗口、多模态多语言，跑分全面碾压 Claude Fable 5、Claude Opus 4.8 和 GPT-5.5。

来自主题: AI资讯

8938 点击 2026-06-16 12:14

低成本复刻Fable 5的路子找到了：OrcaRouter多模型组队，性能反超

AI网关OrcaRouter最近上线了一套可编程路由策略Routing DSL，多个模型同时答题，自动仲裁出最优解。几个你现在就能调用的“常规模型”，给它来个组合编排，跑出来的综合胜率，直接掀翻了Fable 5的单体基准线。Opus 4.8打不过Fable 5，GPT-5.5也单挑不过，但这两个拼一组，结果就反超了。

来自主题: AI技术研报

10157 点击 2026-06-15 15:12