AI资讯新闻榜单内容搜索-斯坦福

在失败中进化？UIUC联合斯坦福、AMD实现智能体「从错误中成长」

伊利诺伊大学厄巴纳 - 香槟分校（UIUC）等团队近日发布论文，系统性剖析了 LLM 智能体失败的机制，并提出了可自我修复的创新框架 ——AgentDebug。该研究认为，AI 智能体应成为自身的观察者和调试者，不仅仅是被动的任务执行者，为未来大规模智能体的可靠运行和自动进化提供了理论与实践工具。

来自主题: AI技术研报

8304 点击 2025-11-07 15:01

斯坦福7B智能体全面超越GPT-4o，推理流登顶HF

传统智能体系统难以兼顾稳定性和学习能力，斯坦福等学者提出AgentFlow框架，通过模块化和实时强化学习，在推理中持续优化策略，并使小规模模型在多项任务中超越GPT-4o，为AI发展开辟新思路。

来自主题: AI技术研报

8968 点击 2025-11-04 10:43

AI「上班流」首次完整曝光！不点鼠标，只写代码，PPT也当函数调

AI已经不止会写代码、画图、做PPT，它也开始「上班」了！CMU与斯坦福的研究团队首次完整追踪了AI的工作过程，发现一个惊人事实：它并不是在模仿人类，而是在用编程的方式重写工作的定义。这场关于「谁在工作」的实验，正在重构未来职场的逻辑。

来自主题: AI技术研报

8424 点击 2025-10-31 14:47

让机器人在“想象”中学习世界的模型来了！PI联创课题组&清华陈建宇团队联合出品

这两天，Physical Intelligence（PI）联合创始人Chelsea Finn在𝕏上，对斯坦福课题组一项最新世界模型工作kuakua连续点赞。

来自主题: AI技术研报

8331 点击 2025-10-31 09:51

地理学的AlphaEvolve？MIT斯坦福让AI自我生长、懂地理、懂世界

让AI懂地理，它才会走得更远。GeoEvolve让AI从助理变成「地理学博士生」，自己修bug、改算法、进化模型——这下，科学家可能真的要有个AI同事了。MIT和斯坦福学者提出了GeoEvolve，尝试了这样一种探索：

来自主题: AI资讯

10195 点击 2025-10-28 13:34

AI在线强化学习“边做边学”，斯坦福团队让7B小模型性能飙升，甚至超越GPT-4o

斯坦福等新框架，用在线强化学习让智能体系统“以小搏大”，领先GPT-4o—— AgentFlow，是一种能够在线优化智能体系统的新范式，可以持续提升智能体系统对于复杂问题的推理能力。

来自主题: AI技术研报

7042 点击 2025-10-25 14:03

斯坦福具身智能大佬引用，Huggingface官方催更：北京人形开源WoW具身世界模型

在「具身智能」与「世界模型」成为新一轮 AI 竞赛关键词的当下，来自北京人形机器人创新中心、北京大学多媒体信息处理国家重点实验室、香港科技大学的中国团队开源了全新的世界模型架构。

来自主题: AI技术研报

9390 点击 2025-10-19 12:34

「微调已死」再添筹码，谷歌扩展AI自我进化范式，成功经验与失败教训双向学习

这几天，关于「微调已死」的言论吸引了学术圈的广泛关注。一篇来自斯坦福大学、SambaNova、UC 伯克利的论文提出了一种名为 Agentic Context Engineering（智能体 / 主动式上下文工程）的技术，让语言模型无需微调也能实现自我提升！

来自主题: AI技术研报

9138 点击 2025-10-15 12:14

斯坦福新论文：微调已死，自主上下文当立

来自斯坦福大学、SambaNova Systems公司和加州大学伯克利分校的研究人员，在新论文中证明：依靠上下文工程，无需调整任何权重，模型也能不断变聪明。他们提出的方法名为智能体上下文工程ACE。

来自主题: AI技术研报

7667 点击 2025-10-11 11:45

斯坦福最新：上下文只能写死在prompt里？用ACE把经验写进可演化上下文『附系统提示』

调模型不如“管上下文”。这篇文章基于 ACE（Agentic Context Engineering），把系统提示、运行记忆和证据做成可演化的 playbook，用“生成—反思—策展”三角色加差分更新，规避简化偏置与上下文塌缩。在 AppWorld 与金融基准上，ACE 相较强基线平均提升约 +10.6% 与 +8.6%，适配时延降至约 1/6（-86.9%），且在无标注监督场景依然有效。

来自主题: AI技术研报

10864 点击 2025-10-11 11:31