Anthropic 上线「做梦」功能,让 Agent 越睡越聪明
Anthropic 上线「做梦」功能,让 Agent 越睡越聪明之前 Claude Code 源码泄露的时候,大家惊奇的发现,里面有一个正在开发的功能:做梦
搜索
之前 Claude Code 源码泄露的时候,大家惊奇的发现,里面有一个正在开发的功能:做梦
AI圈有个怪现象: 模型越来越强,确实是好事;但随着AI用法越发多样,用起来的门槛却越来越高。
Anthropic最新研究让AI先读懂规范背后的意义,再接受行为示范,在特定实验中将Agent失控率从54%压到7%。
看过的人已经傻眼了,因为这可能是今年为止最炸的机器人demo。
随着代码智能从 code foundation models 走向 autonomous coding agents,CLI/terminal 正在成为智能体进入真实软件工程工作流的重要入口。
Claude开发者大会来了!这一次,Anthropic让Agent学会了「做梦」,两次干活的间隙自动反刍记忆、自我进化。配合多Agent兵团作战和自动评分官,AI任务完成率直接暴涨6倍。
最近,一家叫 CopilotKit 的公司宣布完成 2700 万美元的 A 轮融资,由 Glilot Capital、NfX 和 SignalFire 联合领投。这不只是一条融资新闻,它背后指向的是一个更大的问题:当 AI agent 已经可以真正嵌入应用、理解用户意图、生成动态界面、自主执行任务,我们今天所熟悉的软件交互方式,还能撑多久?
当地时间 5 月 5 日,迈阿密一家名为 Subquadratic 的公司走出隐身模式。CTO Alexander Whedon 在 X 上把首款模型 SubQ 称作“a major breakthrough in LLM intelligence”(LLM 智能领域的重大突破),
过去一两年,AI做PPT这事儿一直处在一个比较尴尬的位置。
上次给大家分享了一个 CUA 的开源项目,能让 AI Agent 直接操控电脑界面,相当于把任何 App 都变成 Agent 的 Skill。反响还不错。