
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题自从 Devin(首个全自动 AI 软件工程师)提出以来,针对软件工程的 AI Agent 的设计成为研究的焦点,越来越多基于 Agent 的 AI 自动软件工程师被提出,并在 SWE-bench 数据集上取得了不俗的表现、自动修复了许多真实的 GitHub issue。
自从 Devin(首个全自动 AI 软件工程师)提出以来,针对软件工程的 AI Agent 的设计成为研究的焦点,越来越多基于 Agent 的 AI 自动软件工程师被提出,并在 SWE-bench 数据集上取得了不俗的表现、自动修复了许多真实的 GitHub issue。
来自微软、MIT等机构的学者提出了一种创新的训练范式,攻破了大模型的推理缺陷。他们通过因果模型构建数据集,直接教模型学习公理,结果只有67M参数的微型Transformer竟能媲美GPT-4的推理能力。
生成式 AI 碰撞上自动驾驶技术,会产生怎样的火花?过去,生成式 AI 在业界已经被用来解决自动驾驶的长尾问题。目前,学界开始尝试在算法仿真领域引入多 Agent 数据集来增强仿真的效果。
智能体又双叒叕进化了!这次,什么游戏都能玩,什么软件都能操控了。
AI 崛起,能够自主规划并执行多个步骤的 Agents,正成为用户的接口,也成为开发者的核心着力点。
随便一张立绘都能生成游戏角色,任意IP快速三维化有新招了!
将分析师此前需要2-3个小时完成的工作缩短为2-3分钟。
随着人工智能和大型模型技术的迅猛发展,检索增强生成(Retrieval-Augmented Generation, RAG)已成为大型语言模型生成文本的一种主要范式。
面对GenAI的技术浪潮,很多人都会在不断迭代更新的技术中逐渐迷失。站在潮头的Sapphire、Emergence、Menlo等风投公司,又会如何看待这场AI变局的现状与走向?
共同探讨AI大模型在终端产品上的应用及趋势。