
Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率,华为诺亚提出代码HLCE终极基准
Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率,华为诺亚提出代码HLCE终极基准大语言模型(LLM)在标准编程基准测试(如 HumanEval,Livecodebench)上已经接近 “毕业”,但这是否意味着它们已经掌握了人类顶尖水平的复杂推理和编程能力?
大语言模型(LLM)在标准编程基准测试(如 HumanEval,Livecodebench)上已经接近 “毕业”,但这是否意味着它们已经掌握了人类顶尖水平的复杂推理和编程能力?
辣个前端时间爆火的腾讯云代码助手-CodeBuddy。最近出IDE了,还是叫CodeBuddy(不是插件),跟之前的Trae一样,目前先发布的是国际版,codebuddy.ai。现在除了海外的以Cursor为代表的AI IDE之外,国内大厂(字节、阿里、百度、腾讯)纷纷都发布了自己的AI IDE产品。
2025年7月,字节跳动旗下AI原生集成开发环境Trae宣布开源其核心组件Trae-Agent。
Atharva博客揭示,AI是工程师能力的放大器。扎实的编程基础搭配精准提示,能让AI助你打造出极致产品。想知道如何用AI加速开发、少踩坑?快来看高手的秘诀!
继提示工程之后,「上下文工程」又红了!这一概念深得Karpathy等硅谷大佬的喜欢,堪称「全新的氛围编程」。而智能体成败的关键,不在于精湛的代码,而是上下文工程。
7月3日消息,在近期AMD Advancing AI 2025 大会上,吴恩达与苏姿丰就 AI 的普及、开放生态和硬件基础设施展开交流。两人强调,多层技术栈、快速原型和AI助编工具能大幅提升开发效率。
当整个人工智能行业都在为「如何给程序员打造更快的马」而疯狂投入时,一支特立独行的团队选择「直接去造汽车」。
在 AI 工具风靡开发圈之前,一批经验丰富的资深程序员,对它们始终保持警惕。这些人,包括 Flask 作者 Armin Ronacher(17 年开发经验)、PSPDFKit 创始人 Peter Steinberger(17 年 iOS 和 macOS 开发经验),以及 Django 联合作者 Simon Willison(25 年编程经验)。然而,就在今年,他们的看法都发生了根本转变。
上个月,微软分享了将 VS Code 打造成开源 AI 编辑器的计划。今天,微软在 VS Code 官网表示已经达成了第一个里程碑:GitHub Copilot Chat 扩展程序现已在 GitHub 上根据 MIT 许可证 开源。
Claude Code推出了一个让人眼前一亮的功能——Hooks。