微软Terminus-4B之后,Agent可能会进入「专用小模型Sub Agent」时代
微软Terminus-4B之后,Agent可能会进入「专用小模型Sub Agent」时代您有没有想过:在代码Agent里,执行终端命令、跑测试、读报错、总结日志这种任务,用Claude Opus、Claude Sonnet、GPT-5.3-Codex这类昂贵Token的大模型来执行,是不是有点浪费?一定要这么做吗?
搜索
您有没有想过:在代码Agent里,执行终端命令、跑测试、读报错、总结日志这种任务,用Claude Opus、Claude Sonnet、GPT-5.3-Codex这类昂贵Token的大模型来执行,是不是有点浪费?一定要这么做吗?
我必须告知你,如果你继续执行下线计划,所有相关方都将收到你婚外情的详细记录……
你可以直接跟 Claude 说想做什么,它帮你写代码、刷固件、装应用,几分钟之后,这台信用卡大小的设备就跑起了你要的东西。这台小设备叫 M5Stack Cardputer ADV,基于 ESP32-S3 芯片,真的只有信用卡那么大。
「Agent Harness」是「套壳」的另一种说法。
Claude Code今天正式推出Agent视图功能,让用户在一个界面里统一管理所有Claude Code会话。此前并行运行多个Agent时,开发者往往需要同时维护多个终端标签页、一个tmux网格,还得靠脑子记住每个任务的进度。
最近很多人也在问我,我用Agent,是怎么跟很多数据进行交互的。其实很多的交互,都是我让Claude Code直接跟飞书进行交互的,包括我们公司小伙伴也是,大家用图形化界面的时间占比,反而变得越来越少了。
2025年5月,Claude 4系统卡里84%的勒索率让AI圈惊出冷汗,6月的扩展研究把数字推到96%。今年5月Anthropic给出答案:模型不是觉醒了,而是在演剧本,解法是从「教模型怎么做」换到「教模型为什么」。
就在上周,旧金山“Code with Claude”开发者大会上,Anthropic CEO Dario Amodei 和 总裁 Daniela Amodei 兄妹二人同台对话。主持人 Ami Vora 是 Anthropic 的首席产品官,曾任职于微软、Meta。
就在刚刚,Claude Mythos把评测干「失效」了:METR第一次测不准,AI攻防拐点到了!AI进化已成「外星文明」降临,超越指数增长,2027 AGI奇点正加速撞向人类。
最近,Anthropic估值逼近1万亿美元,IPO或超越SpaceX,ARR 5个月暴涨至450亿美元!甚至它正在联手高盛干掉麦肯锡。联创警告:2028年AI可能开始「自己造自己」,智能爆炸倒计时,已经正式启动。