一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

10298点击 2025-07-29 10:06

又一家支持Claude Code的模型登场！

GLM-4.5

在推理、代码、Agent（智能体）综合能力都达到了开源模型Top1水准，在单个模型中实现了推理、代码、Agentic等能力原生融合。

采用的是混合专家（MoE）架构、混合推理模式（思考/非思考）；总参数355B，激活参数32B，是 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3。

同系列的GLM-4.5-Air，总参数量106B，激活参数12B，在SWE-Bench Verified（真实世界软件工程能力测试）达到最佳性能

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

越往左边走模型越小，越往上边走性能越高。

两个都是开源的，用的还是MIT License，主打走过路过，每个人都能带走。

又到了最关心的API价格环节，

很离谱，输入0.8元/百万tokens、输出2元/百万tokens，隔壁DeepSeek R1输入1元/百万tokens、输出16元/百万tokens。高速版的生成速度超过100 tokens/秒。新用户还送两千万tokens，这下Claude Code总能爽玩了吧。我先来个100块跑跑案例。

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

创建一个梦幻的低多边形漂浮岛屿场景，带有动态光照和柔和的动画，在一个单一的HTML文件中。

01｜可互动网页生成

🔗 chat.z.ai

建议先用z.ai体验一下再换Claude Code，Full-Stack模式下已经幻视代码版Manus了

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

能执行命令、创建todos、写入&编辑代码文件、生成后自带部署。

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

做一个真的用的perplexity AI搜索

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

做出来的AI搜索有模有样的，有默认的搜索推荐、搜索框、复制、分享、还可以存储和删除搜索历史。

后面我还主动提供了tavily的key，GLM-4.5会把信息搜索的逻辑从 z-ai-web-dev-sdk 切换了Tavily API。

这样的话是不是我可以把这段时间配各种MCP拿到的AI搜索Key做成一个混合搜索引擎。

做一个文字版小某书，允许双瀑布流滑动，需要支持点开帖子、发帖、点赞、评论的功能。

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

完成度很高，虽然我没要求，但帖子也能配图，也知道区分不同的人、标题，点赞评论的UI都有做出来，小可惜的是点击后不是实时刷新的。所以后面发布新笔记的时候我刷新了一下，帖子本体也能正常展示出来了。

GLM-4.5在full stack模式下生成的代码都是项目形式的，数据库、前后端通信、网页组件等等都挺全的，代码都可以下载，生成出来的网页可以自己预览，也能直接发布出来。

🔗 m0aav6keycn1-deploy.space.z.ai/

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

比较可惜的是目前Work空间数量限制是两个，创建更多的就要替换了。

02｜PPT & 信息搜索

虽然我很想一句飞到Claude Code的配置，但是z.ai还可以切换不同的模式，

每一个模式会自带1-3个工具，每个模式都可以开启联网搜索，ppt有图片搜索和ppt制作，刚刚测试的全栈开发模式自带的是workspace，我猜是云环境。我还蛮好奇GLM-4.5在PPT制作的表现的，不会学太多代码学傻了吧。

帮我做一份《走进一级方程式赛车（英语：Formula One) 》的PPT

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

说实话，ppt这个赛道太卷了，不管是通用Agent、办公Agent、设计Agent都做ppt，GLM-4.5在色系上保持比较好，搜索到的信息是没问题的，但是文字排版有点密，部分页面的尺寸不太一致，

好就好在，GLM-4.5采用的方法是写HTML网页，而且每一页都可以单独编辑，加上生成速度很快，我这里更换页面的配色方案用了20秒。

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

还在举办的2025年WAIC世界人工智能大会里，

AI教父Hinton演讲了《数字智能是否会取代生物智能》，我让GLM4.5做成ppt了，还是老规矩，公众号发glm 就可以拿到手啦

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

03｜GLM-4.5版Claude Code

迭代到现在，我都快成半个Claude Code区的了，光是我用的就是有三种Claude的变体：

Kimi K2、Qwen3 Coder，和今天的GLM-4.5。之前的吐槽我也都收集起来了，主要还是价格贵、上下文短、以及切换模式带来的配置错误。

Claude Code接入GLM-4.5的过程相当丝滑：

🔗 open.bigmodel.cn/usercenter/proj-mgmt/apikeys

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

顺带一提，在沉浸式翻译可以免费用智谱的GLM-4-flash模型，支持30个并发，我从4月份开始每天都用，用到现在都没掉线过。

Claude Code还是那两个安装命令：

安装：npm install -g @anthropic-ai/claude-code

运行：claude

然后将Anthropic的BASE_URL和AUTH_TOKEN替换成下面的部分：

export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic

export ANTHROPIC_AUTH_TOKEN="your bigmodel API keys"

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

看到这个画面就意味着成功啦！

使用three.js 生成一个由立方体组成的猫咪，然后猫咪在一个平面上原地奔跑的动画，所有代码放在一个html文件里面

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

花了1.9K tokens（0.0008元），也就60s，会原地踏步和转尾巴的3D猫咪来了，GLM4.5还给它加上了可转动尾巴。。。

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

因为GLM-4.5是混合推理模式，这样的话就可以不用Claude Code的plan模式了，

在单次生成的时候就可以通过think关键词来控制模型思考的成本，

"think" < "think hard" < "think harder" < "ultrathink."

先试试看ultrathink版本的3D银河，

创建一个 3D 粒子银河，包含旋转的星云和动态光照效果，ultrathink！

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

花了5k tokens，（0.0004元），带三个方向旋转的星云花得值吗？

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

隔壁Cursor上用Claude4跑了一个，

虽然控制按键多了，但是展示的效果多少有点抽象了，

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

再来一个复杂的3D实验吧，

来自@karminski-牙医的大象牙膏"化学实验“，完整的提示语非常长，我就跟上面的PPT打包一起了。

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

喷发的效果、泡沫的状态、落在平面渐渐消失，大家觉得还原了百分之多少？

3D测差不多了，可交互网页和PPT也测过了，按照惯例来单独看看UI设计，看看GLM-4.5的美感。

从零打造一款广告投放智能仪表盘，支持实时刷新、自由配置与多图表联动展示。

核心数据用超大号中文粗体数字呈现，打造一眼可识别的视觉锚点

整体采用中英文混排风格：中文主导、英文作点缀，增强国际化科技氛围

页面布局强调视觉对比——重点内容用巨型数字、图形强化，次要信息则以细节形式缩小呈现

支持多种图表类型（柱状、折线、饼图等），实时变动的数据可用伪造数据模拟

数据视觉风格采用简洁线条构图，既突出信息，又保持界面清爽

利用高亮纯色 + 透明度渐变制造科技感，避免不同色之间渐变混色

页面滚动联动Apple 风格动效，每次向下滑动皆有过渡或内容浮现，基于 Framer Motion CDN 实现

全站构建技术栈为 HTML5 + Tailwind CSS 3.0+ + JavaScript，界面风格需保持统一性

所有图表组件（如 Chart.js 或 ECharts）必须融合整体视觉语言，不跳脱

图标统一引入自 Font Awesome / Material Icons，通过 CDN 方式加载使用

一手实测GLM4.5满血版Claude Code，可算有将推理/代码/Agent融为一体的大模型了！

做网页类真的是GLM-4.5的舒适区，

基本的审美和交互动画都不差。

写在最后

打脸了打脸了，

一周前刚说完开源赛道是Qwen、Kimi、DeepSeek三个在打，

没想到GLM系列强势回归了，

出手就是单个模型里实现推理、代码、Agentic等多能力融合，

这不是一件简单的事，大模型训练的过程中会出现跷跷板和负迁移，

跷跷板也就是提高其中一个任务的效果，其他任务效果就可能下降，

负迁移意味着多任务学习的效果不如单独训练各个任务，

在线催更技术报告啊！

所以，智谱，这家中国版OpenAI，

不会提前一步把 GPT5 GLM5 开源了吧。

文章来自于微信公众号“卡尔的AI沃茨”，作者是“AI沃茨”。

关键词: AI , AI产品测评 , GLM4.5 , z.ai

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务，堪称「云端超级打工人」而且做到了开源界GAIA性能天花板，达到了57.7%，超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址：GitHub：https://github.com/camel-ai/owl

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/