AI资讯新闻榜单内容搜索-CyberGym

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CyberGym
中国第一,直逼OpenAI!神秘「扫地僧」冲到全球前七

中国第一,直逼OpenAI!神秘「扫地僧」冲到全球前七

中国第一,直逼OpenAI!神秘「扫地僧」冲到全球前七

太疯狂了!一个连官网都没有的神秘中国AI「扫地僧」,以73.1%的胜率杀入CyberGym全球前七,紧咬OpenAI。全网都在疯传,这到底是谁家的高手?它叫MopMonk(扫地僧)。凭借73.1%的成功率,以微弱差距紧咬OpenAI,一举刷新了中国团队在该榜单上的历史最高分。

来自主题: AI资讯
7986 点击    2026-06-30 16:06
刚刚,OpenAI 放出满血版 GPT-5.5-Cyber!剑指 Claude Mythos 5

刚刚,OpenAI 放出满血版 GPT-5.5-Cyber!剑指 Claude Mythos 5

刚刚,OpenAI 放出满血版 GPT-5.5-Cyber!剑指 Claude Mythos 5

就在刚刚,OpenAI 直接放出了满血版 GPT-5.5-Cyber。CyberGym 安全评测排行榜,GPT-5.5-Cyber 得分 85.6%,单模型最高分。Claude Mythos 5 第二,83.8%。Claude Opus 4.7 排末尾,73.1%。

来自主题: AI资讯
9318 点击    2026-06-23 09:09
最强黑客大模型,不再是Mythos

最强黑客大模型,不再是Mythos

最强黑客大模型,不再是Mythos

微软用一套多 Agent 系统在 AI 漏洞发现的顶级基准测试上拿下第一,超过 Anthropic 最强模型 Mythos 五个百分点。诡异的是,微软自己并没有一个能打的前沿模型。它用别人的模型组了个系统,打败了造出这些模型的公司。这对AI竞争格局的启示,比这个工具挖出了大量 Windows 漏洞本身更重要。

来自主题: AI资讯
8088 点击    2026-05-15 13:34