AI资讯新闻榜单内容搜索-

胜率直逼人类大师！这套Agent揭开中国AI「玄学真相」

没有信息泄漏的专业术数题库面前，Claude、GPT等主流模型集体「翻车」。但一个叫Tianfu Agent的系统，却一举将准确率提升至50%，逼近本届术数大赛人类Top20选手的53.5%平均水平。

来自主题: AI资讯

6114 点击 2026-05-25 15:11

一家「非主流」AI公司的豪赌：所有模态，一锅炖了 | 对话智象未来姚霆

多模态训练狠狠烧钱，世界模型公司也都在疯狂融资。

来自主题: AI资讯

8836 点击 2026-05-25 15:11

Claude 通过率不到 4%，SaaS-Bench 撕碎了 Computer-Use 的「全自动办公」幻想

想象一个真实的工作日：项目经理要更新项目状态，财务人员要整理客户账单，医疗管理员要核对预约和保险信息。

来自主题: AI技术研报

10576 点击 2026-05-25 15:10

Z Tech｜对话童晟邦：师从LeCun与谢赛宁，视觉大模型的下一站是World Model

即将结束博士生涯的童晟邦，正站在另一个起点上。

来自主题: AI资讯

7715 点击 2026-05-25 15:10

实测 OmniWork：搞调研、做动画、造游戏，用 AI 攒一个「全干班子」是什么体验？

下一代创作软件比的不是模型能力，而是谁能把完整的创作流程跑通。能让 Agent 从接到目标开始，一路协作推进到交付成品的系统，才是真正的竞争力。 OmniWork 是我们最近看到的明确在朝这个方向走的产品。它给自己的定位是「The Agent OS for Creative Work」，面向创作工作的 Agent 操作系统。

来自主题: AI产品测评

8726 点击 2026-05-25 15:05

AI员工还是大厂的香！我从阿里挖了3个来上班～

大家好，我是袋鼠帝。数字员工、团队这些概念其实已经出来很久了。

来自主题: AI资讯

8443 点击 2026-05-25 14:47

谷歌CEO承认Coding落后了

谷歌CEO皮查伊这次真没藏着掖着，直接一个真心话大放送了：在Coding这事儿上，我们家Gemini确实有点了落后哈…..

来自主题: AI资讯

7472 点击 2026-05-25 14:46

30天烧掉60万亿，扎克伯格没进前250：大厂AI沦为KPI游戏

亚马逊给员工的AI工具装了计量器，官方说不考核，经理盯着排行榜不放。Meta内部榜单30天烧掉60万亿token，扎克伯格没进前250。然而Jellyfish数据打脸：刷10倍token，产出只多了1倍。谁在为这场荒诞游戏推波助澜？

来自主题: AI资讯

9999 点击 2026-05-25 14:46

致超级个体 | To The Crazy Ones

超级个体是一种底层人格结构。1997 年，Steve Jobs 以 Internship CEO 的身份回归到 Apple 后，亲手撰写并配音朗读了 Think Different 广告词。在笔者看来，在 30 年前 Steve Jobs 就已经给“超级个体（Super Individual）”下了一个最贴切的定义，The Crazy Ones。

来自主题: AI资讯

7601 点击 2026-05-25 14:46

从「说错话」到「干错事」：复旦、CityUHK、SMU、UIUC等13家机构联合发布「具身智能安全」综述

具身智能（Embodied AI）正在快速从实验室走向真实世界。

来自主题: AI技术研报

8811 点击 2026-05-25 14:45