AI资讯新闻榜单内容搜索-GE

Agent学会自己「长」Skill了！从失败里长出经验，比人类写的更好用｜ICML 2026

过去一年，Agent学会了两件事：会用工具、会调用Skill。

来自主题: AI技术研报

9234 点击 2026-05-19 10:00

花了1000倍的token，效果可能却没有更好：AI Agent的“隐性账单”长什么样

如今的 AI Agent 正在大规模落地，其中应用最广且最受关注的当数 Claude Code，Codex，Cursor 这类 coding agent。过去的一年里，这类 coding agent 产品迭代迅速，在一年内将在 swe-bench- verified 的准确率提高到了 78%+。

来自主题: AI技术研报

7164 点击 2026-05-19 10:00

「虾马」之后，openJiuwen社区发布JiuwenSwarm，引领蜂群智能体新架构，开启「养蜂」时代

刚刚，华为支持的开源 AI Agent 平台社区 openJiuwen 发布并开源了蜂群智能体 JiuwenSwarm。

来自主题: AI技术研报

9735 点击 2026-05-18 17:42

马斯克花 100 亿想清楚一件事，不做 coding agent 就是等死

OpenAI 的两大宿敌 Anthropic 和马斯克，放下心中成见之后终于在月初结盟了。

来自主题: AI资讯

7566 点击 2026-05-18 16:51

24小时从零写一个GBA模拟器！GPT-5.5跑出53分登顶，Gemini得了0.8分，底部还有两家交白卷

Mechanize 发布了一项硬核测试：给前沿 AI coding agents 24 小时，用 Rust 从零写一个完整的 Game Boy Advance 模拟器，再和顶级开源模拟器 Mesen2 逐帧对比打分。

来自主题: AI技术研报

8498 点击 2026-05-18 16:48

ICML 2026 | 华为GTS提出AI训练数据新方法，Amazon/Google作者团队「光速跟进」：难度自适应训练正在成为新范式

在大模型后训练中，数据不再只是 “越多越好”，而是要像人类学习一样，动态选择最合适难度的样本。华为提出的 EDCO 方法，将样本难度估计与动态课程编排引入领域大模型微调；数月后，由 Rutgers、Amazon、Google 等作者参与的 DARE 论文即引用 EDCO，并将其作为难度感知强化学习训练的重要对比基线。

来自主题: AI技术研报

5741 点击 2026-05-18 15:29

谷歌Gemini 3.2偷跑上线！2200行代码一镜到底，Claude/GPT坐不住了

发布会还没开，谷歌彻底藏不住了！Gemini 3.2 Flash网页端静默上线，被开发者抓了个正着。单次提示狂飙2200行代码、手搓Windows 98，直接把自家旗舰Pro按在地上摩擦。

来自主题: AI资讯

9645 点击 2026-05-18 11:35

Image 2 × Seedance 2.0王炸组合：4套刷屏外网的玩法，提示词全在这了

当「地表最强生图」遇上「最强视频生成」，这对王炸组合再一次点燃了网友们的创作激情。

来自主题: AI技术研报

10649 点击 2026-05-18 10:25

Agent Skills的表示、获取、检索和进化看这一篇综述就清楚了｜香港中文大学最新

早在2024年，人们还倾向于给Agent提供海量的工具（例如通过MCP协议连接的API、搜索引擎、代码解释器等）。但是，“拥有工具”并不等于“知道如何使用工具”。当任务变得复杂且长周期时，要求Agent每次都从头开始推理“该用哪个工具、何时用、怎么组合、出错怎么办”，会导致系统极度脆弱、延迟极高且不可靠。

来自主题: AI技术研报

6934 点击 2026-05-18 09:55

Holy Sh*t，我的大便被卖给 AI 了

Reddit 上的 r/DHExchange 板块从来都不缺奇怪的交易。但月初的一个帖子，还是让见多识广的我打了个问号。「我囤积了一个非常有价值的大型数据库，只是不是你想的那种……15 万张粪便图像。」

来自主题: AI资讯

9038 点击 2026-05-17 22:57