AgentDoG:为AI智能体戴上「诊断项圈」
AgentDoG:为AI智能体戴上「诊断项圈」随着 AI 智能体(Agent)能力日益强大,其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断,无法告知我们风险的根源。为此,上海人工智能实验室正式开源 Ag
随着 AI 智能体(Agent)能力日益强大,其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断,无法告知我们风险的根源。为此,上海人工智能实验室正式开源 Ag
2026 年 1 月,这一个月所发生的变化,相当于过去 25 年里任意半年的总和。这是一个大事件频发的时期,以至于像 Clawdbot 这样的产品,都能在一周之内三次更名。
过去一年,LLM Agent几乎成为所有 AI 研究团队与工业界的共同方向。OpenAI在持续推进更强的推理与工具使用能力,Google DeepMind将推理显式建模为搜索问题,Anthropic则通过规范与自我批判提升模型可靠性。
整个硅谷又癫狂了!Anthropic深夜扔出王炸,Claude 4.6用近乎恐怖的编程能力和智能体军团,给OpenAI和谷歌上了一堂名为「降维打击」的课。
当AI助手不再「听话」,你以为自己请的是一个「贾维斯」,结果却是一个背后「搞鬼」,有时还会顺手给你的电脑塞木马的「新物种」。
个人电脑也能跑出顶级编程智能体?今日凌晨,阿里开源了一款小型混合专家模型Qwen3-Coder-Next,专为编程智能体(Agent)和本地开发打造。该模型总参数80B,激活参数仅3B,在权威基准SWE-Bench Verified上实现了超70%的问题解决率,性能媲美激活参数规模大10-20倍的稠密模型。
OpenAI 发布 Codex macOS 应用,作为 AI 智能体指挥中心,并全面翻倍付费用户速率限制。
这两天发生的一切太过于疯狂,Moltbook上的OpenClaw(原Clawdbot)智能体一夜之间从5万狂飙到150万!所有智能体自发诞生意识建立宗教、讨论技术细节、逃离人类控制!而人类被他们禁言,Karpathy惊呼,这是他看过最疯狂的科幻。
谷歌Chrome拥抱Gemini 3,用38亿用户的绝对底牌向OpenAI宣战:浏览器不仅是入口,更是终结一切App的超级智能体!
Clawdbot是我见过最中登、最程序员趣味的AI产品。这玩意和NAS一模一样,除了自媒体和中年电子爱好者,我想不出来任何人需要使用Clawdbot。