一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!
5444点击    2025-07-29 10:06

又一家支持Claude Code的模型登场!


GLM-4.5


在推理、代码、Agent(智能体)综合能力都达到了开源模型Top1水准,在单个模型中实现了推理、代码、Agentic等能力原生融合。


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


采用的是混合专家(MoE)架构、混合推理模式(思考/非思考);总参数355B,激活参数32B,是 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3。


同系列的GLM-4.5-Air,总参数量106B,激活参数12B,在SWE-Bench Verified(真实世界软件工程能力测试)达到最佳性能


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


越往左边走模型越小,越往上边走性能越高。


两个都是开源的,用的还是MIT License,主打走过路过,每个人都能带走。


又到了最关心的API价格环节,


很离谱,输入0.8元/百万tokens、输出2元/百万tokens,隔壁DeepSeek R1输入1元/百万tokens、输出16元/百万tokens。高速版的生成速度超过100 tokens/秒。新用户还送两千万tokens,这下Claude Code总能爽玩了吧。我先来个100块跑跑案例。


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


创建一个梦幻的低多边形漂浮岛屿场景,带有动态光照和柔和的动画,在一个单一的HTML文件中。


01|可互动网页生成


🔗 chat.z.ai


建议先用z.ai体验一下再换Claude Code,Full-Stack模式下已经幻视代码版Manus了


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


能执行命令、创建todos、写入&编辑代码文件、生成后自带部署。


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


做一个真的用的perplexity AI搜索


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


做出来的AI搜索有模有样的,有默认的搜索推荐、搜索框、复制、分享、还可以存储和删除搜索历史。


后面我还主动提供了tavily的key,GLM-4.5会把信息搜索的逻辑从 z-ai-web-dev-sdk 切换了Tavily API。


这样的话是不是我可以把这段时间配各种MCP拿到的AI搜索Key做成一个混合搜索引擎。


做一个文字版小某书 , 允许双瀑布流滑动, 需要支持点开帖子、发帖、 点赞、 评论的功能。


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


完成度很高,虽然我没要求,但帖子也能配图,也知道区分不同的人、标题,点赞评论的UI都有做出来,小可惜的是点击后不是实时刷新的。所以后面发布新笔记的时候我刷新了一下,帖子本体也能正常展示出来了。


GLM-4.5在full stack模式下生成的代码都是项目形式的,数据库、前后端通信、网页组件等等都挺全的,代码都可以下载,生成出来的网页可以自己预览,也能直接发布出来。


🔗 m0aav6keycn1-deploy.space.z.ai/


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


比较可惜的是目前Work空间数量限制是两个,创建更多的就要替换了。


02|PPT & 信息搜索


虽然我很想一句飞到Claude Code的配置,但是z.ai还可以切换不同的模式,


每一个模式会自带1-3个工具,每个模式都可以开启联网搜索,ppt有图片搜索和ppt制作,刚刚测试的全栈开发模式自带的是workspace,我猜是云环境。我还蛮好奇GLM-4.5在PPT制作的表现的,不会学太多代码学傻了吧。


帮我做一份《走进一级方程式赛车(英语:Formula One) 》的PPT


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


说实话,ppt这个赛道太卷了,不管是通用Agent、办公Agent、设计Agent都做ppt,GLM-4.5在色系上保持比较好,搜索到的信息是没问题的,但是文字排版有点密,部分页面的尺寸不太一致,


好就好在,GLM-4.5采用的方法是写HTML网页,而且每一页都可以单独编辑,加上生成速度很快,我这里更换页面的配色方案用了20秒。


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


还在举办的2025年WAIC世界人工智能大会里,


AI教父Hinton演讲了《数字智能是否会取代生物智能》,我让GLM4.5做成ppt了,还是老规矩,公众号发glm 就可以拿到手啦


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


03|GLM-4.5版Claude Code


迭代到现在,我都快成半个Claude Code区的了,光是我用的就是有三种Claude的变体:


Kimi K2、Qwen3 Coder,和今天的GLM-4.5。之前的吐槽我也都收集起来了,主要还是价格贵、上下文短、以及切换模式带来的配置错误。


Claude Code接入GLM-4.5的过程相当丝滑:


🔗 open.bigmodel.cn/usercenter/proj-mgmt/apikeys


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


顺带一提,在沉浸式翻译可以免费用智谱的GLM-4-flash模型,支持30个并发,我从4月份开始每天都用,用到现在都没掉线过。


Claude Code还是那两个安装命令:


安装:npm install -g @anthropic-ai/claude-code


运行:claude


然后将Anthropic的BASE_URL和AUTH_TOKEN替换成下面的部分:


export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic


export ANTHROPIC_AUTH_TOKEN="your bigmodel API keys"


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


看到这个画面就意味着成功啦!


使用three.js 生成一个由立方体组成的猫咪,然后猫咪在一个平面上原地奔跑的动画,所有代码放在一个html文件里面


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


花了1.9K tokens(0.0008元),也就60s,会原地踏步和转尾巴的3D猫咪来了,GLM4.5还给它加上了可转动尾巴。。。


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


因为GLM-4.5是混合推理模式,这样的话就可以不用Claude Code的plan模式了,


在单次生成的时候就可以通过think关键词来控制模型思考的成本,


"think" < "think hard" < "think harder" < "ultrathink."


先试试看ultrathink版本的3D银河,


创建一个 3D 粒子银河,包含旋转的星云和动态光照效果,ultrathink!


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


花了5k tokens,(0.0004元),带三个方向旋转的星云花得值吗?


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


隔壁Cursor上用Claude4跑了一个,


虽然控制按键多了,但是展示的效果多少有点抽象了,


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


再来一个复杂的3D实验吧,


来自@karminski-牙医的大象牙膏"化学实验“,完整的提示语非常长,我就跟上面的PPT打包一起了。


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


喷发的效果、泡沫的状态、落在平面渐渐消失,大家觉得还原了百分之多少?


3D测差不多了,可交互网页和PPT也测过了,按照惯例来单独看看UI设计,看看GLM-4.5的美感。


从零打造一款 广 告 投放智能仪表盘,支持实时刷新、自由配置与多图表联动展示。


  • 核心数据用超大号中文粗体数字呈现,打造一眼可识别的视觉锚点


  • 整体采用中英文混排风格:中文主导、英文作点缀,增强国际化科技氛围


  • 页面布局强调视觉对比——重点内容用巨型数字、图形强化,次要信息则以细节形式缩小呈现


  • 支持多种图表类型(柱状、折线、饼图等),实时变动的数据可用伪造数据模拟


  • 数据视觉风格采用简洁线条构图,既突出信息,又保持界面清爽


  • 利用高亮纯色 + 透明度渐变制造科技感,避免不同色之间渐变混色


  • 页面滚动联动Apple 风格动效,每次向下滑动皆有过渡或内容浮现,基于 Framer Motion CDN 实现


  • 全站构建技术栈为 HTML5 + Tailwind CSS 3.0+ + JavaScript,界面风格需保持统一性


  • 所有图表组件(如 Chart.js 或 ECharts)必须融合整体视觉语言,不跳脱


  • 图标统一引入自 Font Awesome / Material Icons,通过 CDN 方式加载使用


一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!


做网页类真的是GLM-4.5的舒适区,


基本的审美和交互动画都不差。


写在最后


打脸了打脸了,


一周前刚说完开源赛道是Qwen、Kimi、DeepSeek三个在打,


没想到GLM系列强势回归了,


出手就是单个模型里实现推理、代码、Agentic等多能力融合,


这不是一件简单的事,大模型训练的过程中会出现跷跷板负迁移,


跷跷板也就是提高其中一个任务的效果,其他任务效果就可能下降,


负迁移意味着多任务学习的效果不如单独训练各个任务,


在线催更技术报告啊!


所以,智谱,这家中国版OpenAI,


不会提前一步把 GPT5 GLM5 开源了吧。


文章来自于微信公众号“卡尔的AI沃茨”,作者是“AI沃茨”。


关键词: AI , AI产品测评 , GLM4.5 , z.ai
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/