AI资讯新闻榜单内容搜索-ProgramBen

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ProgramBen
GPT-5.5全球首破!0源码盲写程序,编程AI进入新纪元

GPT-5.5全球首破!0源码盲写程序,编程AI进入新纪元

GPT-5.5全球首破!0源码盲写程序,编程AI进入新纪元

全网AI交白卷的地狱级基准,被GPT-5.5拿下一血!开局0源码盲写程序,拉满推理算力直接满血通关。传统代码测试已废,通往ASI的算力狂飙正式打响。

来自主题: AI资讯
8686 点击    2026-05-13 20:06
刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分

刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分

刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分

SWE-Bench上能拿72%的模型,换张考卷直接归零!Meta联合斯坦福、哈佛放出ProgramBench,200个项目从零手写,9大顶级模型完整通过率0%。最强的Claude Opus 4.7平均通过率也才51.2%。更离谱的是一联网,就有模型在36%的任务里跑去GitHub扒源码。

来自主题: AI技术研报
6156 点击    2026-05-07 12:03