Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物
9783点击    2026-06-10 15:16

Claude 上新


今天凌晨,Anthropic 发布新模型 Fable 5,毫无疑问的,也是当下的最强模型


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


这时候,手机前、刚起床的彦祖可能会问:不是说发的是 Mythos 么?这个 Fable 是啥?其实啊,Mythos 和 Fable 底层是同一个模型,区别在于护栏:


  • 原版的模型叫做 Mythos 5,只给政府和特定机构使用;定价:$25/百万 token输入,$125/百万 token输出
  • 这个加上护栏的、开放给所有人使用的,叫做 Fable 5,定价是 $10/百万 token输入、$50/百万 token输出(刚好比 opus 4.8 贵一倍)


Pro、Max、Team 和按席位的 Enterprise Plan 用户,在6 月 22 号之前都能够使用到 Fable 5(消耗同等用量 Opus 两倍额度),之后要花 usage credits,API 今天就完全可用,模型名称叫做claude-fable-5


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


这里我也浅浅试了一下,体感上确实不错


但是...注意,我说但是了,对于护栏的存在,很多的任务拒绝完成,然后强行退回 Opus 4.8


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


如果是 Claude Code,它则会回复说


Request was blocked 

This request triggered safety guardrails. Rephrase your prompt or rewind to continue.


Anthropic 说触发率不到 5%,我的实际感受远高于这个数字,以至于到目前为止我还没能完整地跑通一个「全程由 Fable 回答」的任务,同时,我发现自己并非唯一的幸运儿


比如下面这个,生物学家对 fable 5 说 hi,然后被拒绝...原因是记忆里面包含相关的生物信息,判定为风险...然后如果开启了隐身模式,就能正常 say hi 了,这就尼玛...


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


所以吧...真可能是我各种奇奇怪怪的事儿做多了,系统觉得「此子必不可留」,让我获得了足够的「不配得感」,所以这篇文章里关于能力的部分,大部分来自官方数据和早期测试客户的反馈,来自官方公告


公告地址:anthropic.com/news/claude-fable-5-mythos-5


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

http://anthropic.com/news/claude-fable-5-mythos-5


一套模型,两个名字


前文提到:Mythos 和 Fable 背后是同一个模型,区别在于护栏


套护栏叫 Fable,没限制的叫 Mythos


而至于名字,Mythos 是希腊语的「神话」;Fable 来自法语的 Fabula 也就是「被讲述的东西」,意思也比较相近


Mythos 级是 Anthropic 在 Opus 之上新立的一个能力层级。今年四月,他们通过 Project Glasswing(玻璃翼计划?这个也没啥正式翻译)放出了第一个 Mythos 级模型 Claude Mythos Preview,只给一小撮网络安全防御者和关键软件基建方


当时就说了,等护栏做好了,会把 Mythos 级开放给所有人,也就有了 Fable


至此,A 社的模型能力排行如下:


正版 Mythos > Fable > Opus > Sonnet > Haiku


斗宗强者


毫无疑问,根据「越新的头部模型越强」的普遍原则,叠加 Falbe/Mythos 是 Claude 家的最强序列,Fable 5 几乎在所有测试基准上都是当前最强,任务越长越复杂,它甩开其他模型越远


比如:Stripe 拿 Fable 5 跑了一个五千万行的 Ruby 代码库的全库迁移, 一天做完。同样的活儿,一个团队手工干要两个多月。Fable 5 还比过去的 Claude 更省 token,同样的难题花的钱更少。在 Cognition 的 FrontierCode 评测上,它在中等推理强度下就拿了前沿模型里的最高分


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


拿到早期权限的客户各自跑了测试,挑几句看看口径:Cursor 的 Michael Truell 说它在 CursorBench 上是最强模型,打开了一类过去够不着的长周期问题。GitHub 的 Mario Rodriguez 说它接复杂的长周期编码任务,自主性和可靠性超过了之前的基准。Cognition 的 Scott Wu 说它是 FrontierBench 上得分最高的模型,开箱就能泛化到陌生工具。Replit 的 Michele Catasta 说它在自家的 vibe-coding 评测上几乎跑满


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


恐怖如斯


作为宗门的新一代天骄,Fable 5 它是通关了宝可梦的


过去的 Claude 玩宝可梦,是得搭一套辅助 harness,负责喂各种游戏状态。Fable 5 只看原始截图,就把《宝可梦 火红》从头打到尾通关了,这个水平,直指当年还在接受九年义务教育的我,不愧是宗门天骄


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

之前那套喂地图喂状态的 harness,不再必要了


它还能从科学图表里抠出精确数字,看几张截图就把一个网页应用的源码重建出来


记忆和长上下文也上了一个台阶,比如让它玩《杀戮尖塔》,给它一份持久存取的文件当记忆,成绩提升是 Opus 4.8 的三倍,打到最终幕的次数也是三倍...这怎么玩的游戏和我一样,不愧是能与我比肩的斗宗强者


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


至于剩下的,Anthropic 放了四个 demo,我一个一个贴


第一个,它从物理第一性原理推导行星轨道运动,拿这个预测日食


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

日食模拟,从万有引力开始算的


第二个,它自己玩《异星工厂》Factorio,自己规划策略、自己把自动化流水线搭起来


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

很休闲的一款游戏,推荐大家试试


这个游戏好啊,益智、提神、醒脑,和我一样喜欢玩这个游戏,难怪 Fable 这么聪明


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


第三个,它在浏览器里的 CAD 编辑器里设计了一个完整的可 3D 打印模型。那个 CAD 编辑器也是它造的,包括里面的 AI copilot


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

编辑器是它造的,模型也是它设计的


第四个,它写代码做了一段流体模拟,流体的运动卡上一首古典 EDM remix 的节拍。那首 remix 也是它用代码生成的,它从没听过音乐


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

从没听过音乐,用代码作了首 EDM


知识工作方面,Hebbia 面向资深推理的金融评测里,Fable 5 拿了所有模型的最高分。IMC 说它的交易分析评测几乎全项满分


假设被实验室证实


Mythos 5 在生物科研上做到的事,跑分表格装不下了


先说药物设计。Anthropic 内部的蛋白设计专家用 Mythos 5,把药物设计过程的部分环节加速了约十倍。有一个例子,Mythos 5 拿着蛋白设计和生物信息学工具,在无人干涉下,做到了匹配甚至超过熟练的人类操作者,把项研究里的 14 个蛋白靶点,9 个产出了值得继续做药的强候选


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

免疫检查点、神经退行、肌肉病这些靶点,9 个出了强候选


Mythos 5 是 Anthropic 第一个能稳定产出新颖且站得住脚的科学假设的模型。在盲测对比里,科学家有大约八成的时候更偏好 Mythos 的分子生物学假设而不是 Opus 级模型的。对于实验假设,有些已经出成果了:比如一个关于大肠杆菌某蛋白的新机制,已被相关实验室的研究证实了


基因组学那边,Mythos 5 在超过一周的大体自主的工作里做了一项新研究。它把横跨 138 个动物物种、数百万个细胞的单细胞数据组装起来,自己设计并训练了一个机器学习模型,用来识别在亲缘很远的物种里执行相同功能的细胞


Mythos 训出来的这个模型,超过了最近发表在 Science 上的一个模型,体积还小了 100 倍,结果计划未来几个月发表


护栏


可能我的记忆里的信息比较诡异,导致简单的任务我能跑


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


复杂的请求就被退回


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


背后 Anthropic 给 Fable 5 套了一组分类器,单独的 AI 系统,盯着每一轮对话,判断你的请求有没有碰到三个区域:网络安全、生物化学、蒸馏。碰到了就把球扔给 Opus 4.8


Anthropic 说平均触发率在 5% 以下,超过 95% 的会话完全不触发。但这个数字是按会话数算的,发个「hi」也算一个会话。真拿它干活,尤其是长任务,体感完全是另一回事


任务一长,中间某一轮碰了分类器,整个对话就从 Fable 切到了 Opus,后面的回答都是 Opus 4.8 在给你稳稳接住


再比如我的历史记忆比较复杂,可能就会莫名其妙的被视作宗门细作,退回的时候界面顶上会顶出一行「Switched to Opus 4.8」,右边给你一个「Edit and retry with Fable 5」,让你改改话术再撞一次护栏


就比如下面这个极为正常的工作:翻译全文:https://www.anthropic.com/news/claude-fable-5-mythos-5


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

Edit and retry 这词起得讲究...


Claude Code 那边也一样,碰到护栏就直接弹 Request was blocked,让你改问题或者回退


再说回 Fable 的三类拒绝回答


第一类是网络安全。Mythos 级模型擅长找漏洞、利用漏洞,还会做 agentic hacking,把侦察、横向移动这些环节自己串起来。护栏直接让 Fable 在这类任务上做不出任何进展


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


Anthropic 做了大量红队测试,外部 bug bounty 跑了超过 1000 小时没找到通用越狱,外部红队在长周期 agentic 任务上也没找到,只有英国 AISI 在一个很短的初始窗口里有所进展


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


一家外部合作方测下来,Fable 5 在有害网络请求上的护栏是所测全部模型里最硬的,比 Opus 4.8 和 4.7 都硬,对 30 种公开越狱技术零突破


第二类是生物和化学。过去只挡很窄的一撮生物武器问题,现在 Anthropic 觉得不够了。他们测了 Mythos 5 预测一种病毒外壳组装的能力(用的是 Dyno Therapeutics 未发表的候选),那是设计基因治疗载体 AAV 的一步,同样的本事换个人用就能拿去设计危险病毒


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物


Mythos 级模型光靠生物推理就超过了专门做蛋白任务的蛋白语言模型。为了尽快安全发布,眼下 Fable 把大部分生物化学请求都退回给了 Opus 4.8,往后会慢慢收窄


第三类是蒸馏。Anthropic 此前发现过大规模的蒸馏企图,而之后这些行为,会被分类器标记为蒸馏,然后退回 Opus 4.8


还有一处变化跟企业客户直接相关。Mythos 级模型的所有流量,无论是 Anthropic 自家界面还是第三方,都要求 30 天数据保留


这些数据不拿去训练、不做安全以外的用途,会记录所有人类访问,30 天后删除


先免费,6 月 22 截止


打开网页版会先弹一个框,告诉你 Fable 5 在 6 月 22 号之前算在套餐额度里,但它吃额度是 Opus 的两倍。6 月 23 号起从订阅计划里撤掉,之后要用得花 usage credits


等容量够了,再把它恢复成订阅计划的标准配置


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

吃 Opus 两倍额度,6 月 23 号起这部分得自己掏 credits


网页版的模型列表里能直接选到 Fable 5,旁边标着「Included until June 22」。Claude Code 那边,无论是 terminal 还是 Claude 应用,列表里默认看不到它,得手动敲 /model claude-fable-5 才能切过去


Claude 最强模型 Fable 5 全解析:Mythos 级别的怪物

网页里能选到,Claude Code 里得敲 /model claude-fable-5 才出来


平台这边,claude-fable-5 在 Claude API、AWS 上的 Claude Platform、Amazon Bedrock、Vertex AI、Microsoft Foundry 都能调


Mythos 5 则不公开,只给 Glasswing 的合作伙伴(拆了网络安全护栏),以及不久后选定的一批生物研究者(拆了生物化学护栏)。Anthropic 说会跟美国政府一起,稳步扩大 Mythos 5 的可信访问名单,还要开一个让网络安全机构系统化申请的通道,另开一个面向生物研究的通道


文章来自于"赛博禅心",作者 "金色传说大聪明"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0