今天凌晨,大家等了很久的 Claude Fable 5 终于上线了。
这回的期待值格外高。因为它是 Claude 的一个整数代模型,而之前从 4.6 到 4.8 那几版,说句不好听的,提升实在有限,所以这次大家反而更期待了。
我为了测它,直接拿它画了一张建筑 CAD:

还有马斯克星舰的 Raptor 3 发动机模型:

只能说一句,牛逼。
Fable 5 的 benchmark 参数对比也放出来了,几乎全面领先上一代的 Opus 4.8,也领先 GPT 5.5,基本所有项都有不小的提升。

其他技术报告全网都有,我就不多说了。
不过话说回来,从 4.6 到 4.8 那一代,benchmark 分数也更高,但大家在实际体验里根本没感觉到,甚至有人觉得更差。所以这次的 benchmark 我也没太当真。分数是一回事,真正值得看的,是它在实际场景里到底怎么用、能做出什么东西出来。
先说怎么用。
Fable 5 的定价是每百万输入 token 10 美元,每百万输出 token 50 美元,几乎翻了一倍。
从现在到 6 月 22 号,Fable 5 可以在 Pro Max、Team 和按席位算的企业版套餐里直接用,订阅里就能用,不用额外付费。
但 Claude 的营销策略一如既往地抽象。6 月 23 号开始,订阅里就不能再用 Fable 5 了,想用得另花使用积分。API 倒是一直能用。等之后资源够了,他们会再把 Fable 5 放回订阅里。
所以就是现在能用,趁 22 号之前赶紧用个爽,过了这天可能就用不上了。😆

具体怎么用,我其实想了很久,到底拿什么场景去测这一代 AI 的能力。
前段时间,大家一直在讨论把 Claude Code 或者 Codex 跟产业界的各种软件联动起来,挺好玩的。比如我之前就让 Codex 联动 Blender,做了一个人体模型,反响还不错,挺多朋友来问怎么弄。
当时我还看到另一个更有意思的玩法:让 Claude Code 或者 Codex 去画 CAD。
说干就干。
第一步,下载一个 FreeCAD,这是个开源软件。然后让 Claude 给它配一个 MCP server 就行。
Fable 5 给我的第一个印象就是执行速度非常快。换成用 Codex 配这套,明显要慢一些。
这回我给了 Fable 5 一段非常长的建筑 CAD 提示词,几乎每个细节点都写清楚了。

Fable 5 对提示词的遵循能力强了不少,思考也快,整个执行流程下来,体感上比以前流畅很多。它几乎是自己从 0 开始,完整做出了一张建筑 CAD :

高清大图长这样:

比较牛逼的是,这次一遍就成了,全程没有一个报错。它在自检的时候也没发现任何报错,没做任何修改。从提示词到最后的成图,一遍过。

我是 Claude Pro 5X 用户。画完这一整套,包括让它导出 PDF、PNG 和 DXF 文件,完整在系统里画完,只用了 15% 到 25% 的小时额度,也不算特别夸张。

刚好这段时间我研究 AI 和 CAD 的联动已经有一阵了,也看过不少 CAD 建筑图。我让 Codex 和 Fable 5 互相点评了一下。能看出来这张 CAD 图整体是比较完整的。
墙体、门窗、可编辑性,还有出图质量,以及尺寸链、窗位链这些细分项,都做得比较齐全。
但我自己不是搞建筑土木的,没法很好地评判这张图。这时候我突然想起来,我老爹就是在土木行业干了很多年的工程师,手底下带过不少项目经理。这不就是现成的专家。
我就把图直接发给了他。
老爹只回了一句,
画得还可以,但是有错误。
光看前半句,挺让我震撼的。因为从一个专业从业者嘴里说出「画得还可以」,就说明这张图已经过了最基础的工业级门槛。也就是说,它推翻了我之前的一个看法:总觉得 AI 现在被吹得这么火,可在真正的产业和工业里还是创造不了价值。

我接着问,这种图如果换专业从业者来画、换普通人来画,各要多久。老爹说,他自己画大概 10 到 15 分钟;要是普通实习生或者普通人来画,可能得花上半天到一天。

然后老爹又仔细查了查这张图,给我挑出了一堆错误,光细致的点就列了 11 个。这其实也正常。大家平时看 AI 画 CAD 觉得挺炫,但里面确实还有不少错,这点得承认。

不过只让 Fable 5 画一份、再让专业人士点评,普通人其实看不出太多差别,也看不出这一代模型到底比上一代强在哪。所以我又让 Codex GPT 5.5 XHigh 完整画了一份,做个对照。
下面这张就是 Codex 做的。说实话,哪怕只用普通人的眼光看这张图,我自己都能挑出一堆问题。很多地方画得很离谱,比如左下角和左中部那几处玄关的开口,完全是错的,错得相当夸张。

虽然版面要素还算齐全,普通人第一眼观感可能还行。但整个墙体几何和工程性,是完全过不了关的,明显的错误太多了。
这时候我又把老爹请了出来。我问他,这张新图怎么样,满分 10 分能打几分。老爹还是只回了一句:
这个更差。
当场把我整尬住了……

至于差多少,老爹给的说法是,差了 80%。

之后我又让 Fable 5 给两份图打分,自己画的那张和 Codex GPT 5.5 XHigh 画的那张。它给自己打了 8 分,几乎所有项都在 7 分以上。

而 Codex 那份,基本就是 3 分、5 分的水平。

绷不住了。
再说 FreeCAD,它最拿手的场景其实是画模型。论画 CAD,它没有 AutoCAD 那么专业,但用来画 3D 模型会更合适。
于是我又让 Fable 5 画了一个马斯克星舰的 Raptor 3 发动机模型 :

我在提示词结尾加了一条,让它自己再去调研一下 Raptor 3 的外观构造,然后做自检。当然 Raptor 3 的真实构造是保密的,外界也不太清楚,这里主要是看看整体效果。
这是它做出来的:

完整效果:

放大看其中一个泵组件的细节 ——

有意思的是,它在最后自检的时候,真的去查了相关资料做对比。查完它发现,真机有一组从喷管顶部卡箍带斜拉到托盘的花篮螺丝拉杆,于是又专门补建了 4 根,做了最后一轮迭代。
下面这个是 Codex 画的……抽象到我专门回去确认了一下自己的提示词是不是有问题,搞得我好像有点太黑 Codex 了 :

改了一遍,长这样:

高下立判。
两个月前,我就已经完全转向 Codex 了,还买了 Codex 的 Pro 5X。那会儿是 Claude opus 4.7、4.8 的时代,我觉得这两个模型实在太差了,比 4.6 差远了,就干脆转过去了。
但现在,对不起了。我的忠诚度有点撑不住,接下来真得考虑要不要再回 Claude 的怀抱了。
最后就一句话:
GPT 6 什么时候出啊?是不是也该来了?求求了。🙏
文章来自于"AI Humanist by杉森楠",作者 "杉森楠"。