这就是未来解决难题的方式?
只要你输入自然语言指令和必要的数据,一群智能体就可以针对复杂问题设立项目进行研究,自己去寻找解法。

不论是金融、交通还是港口物流领域,人类专家需要几十天才能完成的工作,使用 AI 智能体只需要几天甚至几小时,还能找出更优的解法。


这一系列效率的提升,都来自于昨天百度世界大会上新发布的全球首个可商用、自我演化超级智能体百度伐谋,由百度智能云团队打造。目前,伐谋已正式对外开放,并通过邀请码的形式提供服务。
在大会现场,李彦宏表示,这是一个全新的、能自我进化的智能体,能够在各种重要工业应用场景中自动找出全局最优解,「只要问题的解法是明确可验证的,伐谋就可以模拟甚至超越顶尖的算法专家。」

从入门的代码生成,到高阶的全业务流程优化,ChatGPT 出现还没满三年,AI 就已经实现了能力维度上的扩展,实现了从「执行指令」到「自主发现」的跨越,甚至还能发现人类无法想到的解决方案。
四大核心技术
打造 AI 优化引擎标杆
伐谋是一个让 AI 算法自主进化、寻找全局最优的多智能体系统,可以高效率地解决高难度的问题。它结合了大语言模型和进化搜索算法,旨在通过大语言模型的推理能力与大规模进化搜索来解决复杂的现实世界问题。
面对现实世界的复杂问题,如何能让 AI 代替算法工程师来寻找解法,并进行调优,是一个很有挑战的任务。
百度智能云团队发布了伐谋(FM Agent)的技术报告,我们可以从中了解其主要的技术特点。

伐谋系统在处理复杂算法问题时的工作流程。
整体来看,伐谋具备跨领域、端到端的自动化问题求解能力,涵盖以下四大场景:
在工作的整体逻辑上,伐谋在收到指令后首先使用智能体寻找算法,选择优势品种进行进化,在这其中应用的方法既包括经典的专家策略,也有 AI 搜索,在这之后,生成的方法会被组合成为一个复杂的 Prompt 交给大模型,形成一个新算法。新的算法会交给到人类写好的评估器上判断质量,打分会作为依据交给下一轮的再采样生成。
在技术方面,伐谋具有四大核心技术特点:
使用昆仑芯一体机进行运算,难度较大的任务可能需要数十小时、几天的求解时间,简单的任务可能只需要几小时。
报告显示,伐谋在多个领域都有出色的表现,在多个权威基准测试中都取得了领先的性能。在 MLE-Bench 上达到了 43.56% 的奖牌率,比人类中位数高出 51.56%;在 ALE-Bench 上得分为 1976.3,比专门设计的 ALE-Agent 高出 5.2%;在 KernelBench 上则实现了 2.08 到 20.77 倍的加速比。

需要注意的是,所有实验均是全自动运行的,没有人类干预。伐谋在打榜时也没有针对 Benchmark 进行针对性的优化。
目前能看到一些学术上的同类工作,大多集中于单点问题上,而如何在实际场景中解决问题、提升效率,才是伐谋关注的重点。伐谋的产品负责人表示,伐谋在很多一个月才能解决的复杂问题上优势更大。
如果做一个比喻的话,在各行各业的专家团队中,应用 AI 以前需要专家团队自己来写算法,应用伐谋之后,相当于有了数倍的算法工程师一起来写算法,他们能够生成的算法水平更好。
另外,随着业务的落地,AI 生成的方法可以持续进行动态调整,打磨出更好的效果。可以说,伐谋不仅推动了智能体的技术发展,也为企业 AI 技术落地提供了可行的工程范本。
面向产业级应用
AI 自主优化引擎,已在大规模落地
作为面向实际的 AI 优化引擎,伐谋在很多行业生产、研发场景中的重要环节上都能展现能力,它能够自动将实际问题抽象成数学算法问题进行解决。
在这个过程中,AI 提出的评估指标明确,产生的解决方案价值很高,而且可以持续迭代优化。伐谋能够搞定的领域包括但不限于:路径规划、过程控制、排产调度、资源优化、机器学习和性能优化。

输入必要的数据并使用自然语言给出指令,伐谋就可以对问题进行准确的理解,自行提出思路进行解决和优化。伐谋利用大语言模型作为核心,并支持代码生成,可以修改代码文件。在生成解决路径的过程中,伐谋擅长于平衡对新算法的探索,在生成解法的过程中鼓励多样性。
它会使用自动化评估机制对生成的程序进行评分,这些评估结果也会被用于指导后续的代码生成。这样,就形成了一个「抽象 - 建模 - 演化」的智能闭环。
百度的工程师表示,伐谋旨在解决那些难度极大、人类解决得不太好的问题。基于人类专家们的知识,伐谋的自动输出就像是给人类智慧进行了 Scaling Up。
目前,伐谋已经在很多场景中展示了能力:
此外在 AI 的性能优化上,百度正在利用伐谋优化 LayerNorm、FlashAttention 等 CUDA 算法,据说比 PyTorch 官方实现的速度还要更快。
随着大模型分析、推理能力提升,我们可以逐渐地把评估,Coding 等任务交给 AI。解决复杂问题的多个步骤,现在可以被智能体加外部环境构成的系统进行接管。
一个新的范式正在逐渐形成 —— 由人类来定义问题,发现和抽象需求,AI 来负责进行实践。
进化式智能体
AI 发展新趋势
在 AI 前沿领域,能够进化式编程的智能体已经成为新的发展方向。利用 AI 大模型的能力,多智能体系统能够自主生成、测试并迭代优化算法,甚至发现全新的算法,这标志着 AI 在算法优化和编程领域迈出了突破性的一步。
相比于基于数学、运筹学的求解器与单一大模型系统,自主优化的智能体可以解决更多、更复杂的问题,提出创新形式的解法,同时还降低了对于使用者专业知识的门槛。
其中的典型就是今年 5 月谷歌 DeepMind 发布的 AlphaEvolve,这是一款用于发现和优化通用算法的平台,基于 Gemini 大语言模型与进化算法策略开发,具备自主生成和优化通用算法的能力。AlphaEvolve 正式发布之前,谷歌已经在内部进行了落地,它能把大模型加速注意力算法 FlashAttention 的核心效率提升 32.5%,还优化了 50 年没有改进的矩阵最佳算法。

AlphaEvolve 帮助谷歌构建了更高效的数字生态系统,从数据中心调度、硬件设计到 AI 模型训练都有涉足。
上周,著名数学家陶哲轩在其新研究中展示了 AlphaEvolve 自主发现数学构造的能力,AI 方法推动了人们对长期未解数学难题的理解。
可见,在一些真实世界的复杂任务上,智能体已经可以帮助人们高效率地解决问题了。如果这种技术大规模应用,可以在很多领域上为人们带来生产力的提升。
不过,此前我们看到 AI 解决复杂问题的能力,主要面向的是科学研究领域,而百度新发布的伐谋作为全球首个同类商业化产品,更加面向行业,还做到了更全面、更加自动化。
AI 革新生产力
布局才刚刚展开
李彦宏表示:「当 AI 能力被内化,成为一种原生的能力,智能就不再是成本,而是生产力。AI 能够提升决策质量、发现新增长点,让成本更低、利润率更高、创新周期更短。」
不论是从技术角度,还是从实用的角度看,伐谋都是一款通用、强大且可扩展的智能体框架,引领了目前 AI 大规模技术落地的前沿方向。
如今,智能体正在从与我们「对话」走向帮我们「决策」。从已经出现的落地案例来看,还有很多各行各业的关键生产环节有能被 AI 优化的潜力。
在百度看来,目前基于 AI 的自主优化引擎仅仅处于落地的初期。随着标杆客户的验证,AI 的优化能力会在业务链条上的每个环节上逐渐显现。
伐谋的能力,将会服务于千行百业。
据百度介绍,百度伐谋发布首日已经吸引了超 1000 家企业申请接入测试,覆盖交通、能源、金融、物流等行业。目前百度伐谋测试名额持续开放中,首批将通过邀请码形式优先向具有高复杂决策需求的企业开放。
文章来自于微信公众号 “机器之心”,作者 “机器之心”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0