AI资讯新闻榜单内容搜索-GE

混元开源PhoneBuddy-4B与5篇系列论文：多项手机Agent真机评测超过GPT-5.4

过去一年，Mobile/Phone-use Agent在各类评测榜单上进展很快。

来自主题: AI技术研报

8234 点击 2026-06-26 09:47

和 Codex、Claude Code 等 Coding Agent 沟通，很多时候就像站在许愿池边，对着池子里的王八扔硬币，嘴里念念有词，关键它还真给你兑现愿望。

来自主题: AI技术研报

6898 点击 2026-06-25 15:26

今年2月，英伟达公开了一条内部AI工作流。

来自主题: AI技术研报

10093 点击 2026-06-25 15:24

最近看到越来越多的一些国民级产品，开始把自己的一些能力，给封装称Skill或者MCP，来向大家开放，我觉得这个大家逐渐为Agent来做能力的趋势，越来越明显了。特别是前段时间瑞幸咖啡上线了AI开放平台，支持MCP、CLI、Skill三种接入方式。

来自主题: AI资讯

9143 点击 2026-06-25 10:36

谷歌留不住人了！诺奖得主离职后，Gemini两大核心将一同入职Anthropic。同一天，Gemini 3.5 Pro已延期至7月。

来自主题: AI资讯

5821 点击 2026-06-25 10:30

最近，Anthropic 团队研究产品经理 Theodora（Theo）Chu 的一段演讲视频，引起了大家的注意。

来自主题: AI资讯

9855 点击 2026-06-25 10:29

写代码、跑实验、改项目、迭代方案，现在的AI智能体样样都能搞定。

来自主题: AI技术研报

6705 点击 2026-06-25 10:28

DeNovoSWE是一个用于训练代码智能体从零生成完整仓库的数据集，包含4818个真实任务实例。它通过结构化文档和严格验证机制，帮助智能体掌握复杂系统构建能力，而不仅仅是修复代码。这为代码智能体迈向更高阶的软件工程任务提供了关键支持。

来自主题: AI技术研报

9619 点击 2026-06-25 10:04

当 AI 智能体（Agent）从实验室走向真实应用，我们面对的安全问题也正在发生变化。

来自主题: AI技术研报

9882 点击 2026-06-25 10:03

一个模型能模拟7种环境。

来自主题: AI技术研报

9261 点击 2026-06-24 16:58