刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分
刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分SWE-Bench上能拿72%的模型,换张考卷直接归零!Meta联合斯坦福、哈佛放出ProgramBench,200个项目从零手写,9大顶级模型完整通过率0%。最强的Claude Opus 4.7平均通过率也才51.2%。更离谱的是一联网,就有模型在36%的任务里跑去GitHub扒源码。
搜索
SWE-Bench上能拿72%的模型,换张考卷直接归零!Meta联合斯坦福、哈佛放出ProgramBench,200个项目从零手写,9大顶级模型完整通过率0%。最强的Claude Opus 4.7平均通过率也才51.2%。更离谱的是一联网,就有模型在36%的任务里跑去GitHub扒源码。
迪士尼最近就做了一件「很不迪士尼」的事。它在内网上线了一块看板,名字直白得不像那个出品白雪公主的公司——「AI Adoption Dashboard」。看板上滚动着三个数字:每个员工调用AI的频率、请求次数、token消耗量。Claude是主要追踪对象。
小扎又出手了,这次瞄准的是人形机器人。 Meta正式完成对机器人AI初创公司Assured Robot Intelligence(简称 ARI)的收购。这家公司专注于机器人智能底层技术,由华南农业大学、中山大学校友王晓龙联合创办。
谷歌母公司Alphabet营收达到1099亿美元,每股收益5.11美元,远超华尔街预期的2.62美元;亚马逊净销售额1815亿美元,净利润303亿美元,每股收益2.78美元,几乎是预期的两倍;微软营收829亿美元,同比增长18%;Meta净利润268亿美元,同比接近翻倍。
根据《华尔街日报》报道,在中国国家发改委于周一要求撤销相关收购交易后,Meta 正在准备撤销对 Manus 的收购。
4月27日,监管依法禁止美国科技巨头Meta收购中国AI企业Manus,并要求撤销该交易。对Manus来说,最直接的冲击就是20亿美元的交易泡汤了,管理层、核心员工、投资人等也失去了一个“绝佳”的退出机会。
4月27日,Manus和Meta那笔传了几个月的交易,终于等来了最终结果。不是“继续审查”。不是“补充材料”。而是禁止投资,要求撤销交易。这几个字很重。
Meta内部搞了个AI用量排行榜「Claudeonomics」,8.5万员工拼消耗、冲段位、抢「Token传奇」称号。有人一个月烧掉200万美元,有人写外挂冲榜,有人挂着Agent睡觉也在跑——硅谷卷Token,已经卷到走火入魔了。
Meta被曝全天候录屏监控员工操作训练AI智能体,8000人裁员同步推进——你亲手教会的AI,可能正在取代你。
4 月 20 日,Meta 和房地产与基建服务公司 CBRE 联合宣布推出 LevelUp,一个四周、完全免费的光纤技术员培训项目。今年夏天起,它将为 Meta 的美国数据中心工地培养 “数千名” 没有任何行业经验的新手。