北京时间今天凌晨,Anthropic正式发布了Claude Sonnet 4.5。
这一版本被Claude定义为全球最强的代码模型,同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。
代码无处不在,它驱动着应用程序、表格和各种工具。
现代工作的核心在于运用这些工具并解决复杂问题,而Sonnet 4.5让这一切更加高效和可靠。
全新功能与产品升级
伴随Sonnet 4.5,Anthropic对Claude全线产品进行了大规模更新:
开发者社区也迎来了新的核心资源:Claude Agent SDK。
这套工具包开放了驱动Claude Code的底层基础设施,为所有人打造智能体提供了基础能力。
前沿性能与基准成绩
Sonnet 4.5在多项权威测试中表现出色:
视频演示了Claude for Chrome的模拟操作计算机任务能力
这些进展不仅体现在数据中,也得到了提前体验的专业用户们的高度评价:
Claude Code能自主编程30小时以上,帮助工程师在极短时间内完成原本要花费数月的架构工作。——Sean Ward, iGent AI CEO
replit内部代码编辑测试中,错误率从Sonnet 4的9%直接降至0%。——Michele Catasta, replit President
更强的对齐,更安全
Sonnet 4.5是迄今为止对齐性最好的Claude模型。
通过改进的能力和广泛的安全训练,模型在减少迎合、欺骗、权力追求和虚妄鼓励等行为方面取得了明显成效。
在智能体和计算机使用场景中,团队也特别加强了对提示注入攻击的防御。
这些改进已在系统卡(System Card)中以详细评估形式公开,其中首次引入了可解释性技术来验证安全性。
Sonnet 4.5按照AI Safety Level 3(ASL-3)框架发布,包含一系列防护措施,例如针对化学、生物、放射和核相关内容的分类器过滤机制。
虽然这些过滤器可能偶尔误判正常内容,但与Sonnet 4相比,误报率已降低十倍,并将在未来继续优化。
Claude Agent SDK
在过去半年中,Claude团队不断迭代Claude Code,探索了智能体设计中的核心挑战,包括长时任务的内存管理、权限体系的平衡,以及子代理的协同方式。
如今,这些能力通过Claude Agent SDK向开发者全面开放。
Claude Agent SDK演示视频
SDK不仅适用于编码,还能支持更广泛的应用场景。
它为构建复杂任务的自主智能体提供了与Anthropic内部工具相同的基础设施。
研究预览:「Imagine with Claude」
作为额外的实验,Anthropic发布了一个临时研究预览——「Imagine with Claude」。
Imagine With Claude实时生成软件演示视频
在这一体验中,Claude会实时生成软件,没有预设功能或预写代码,用户可以直接看到Claude在交互过程中即时创造与适配的过程。
该功能向Max订阅用户开放5天,可在claude.ai/imagine上体验。
API新特性
Sonnet 4.5在API层面也带来了重要更新:
model_context_window_exceeded
,更清晰地标识因上下文限制而中止生成。定价与使用渠道
价格保持与Sonnet 4一致:
Sonnet 4.5可通过以下渠道使用:
claude-sonnet-4-5-20250929
anthropic.claude-sonnet-4-5-20250929-v1:0
claude-sonnet-4-5@20250929
升级指南
当前使用Sonnet 4的开发者,只需将模型名称更新为claude-sonnet-4-5-20250929
即可完成迁移。
所有现有API调用依然有效。建议同时启用新特性,例如记忆工具和上下文清理,以充分发挥模型性能。
需要注意的是,Sonnet 4.5不再允许同时指定temperature和top_p参数,用户应选择其一。
新一轮的AI编程大战即将来临
Claude Sonnet 4.5在编码、智能体能力、计算机使用和安全性方面实现了全面跃升。
它既是开发者工具箱中的新利器,也是一个能在金融、医学、科研等领域提供专业支持的强大平台。
Anthropic通过这一版本,继续推动AI在前沿能力和安全性上的平衡发展。
编程新王降临,新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。
参考资料:
https://www.anthropic.com/news/claude-sonnet-4-5
https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5
https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf
文章来自于微信公众号 “新智元”,作者 “新智元”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md