一文搞懂 Agents 评测丨Anthropic 最新万字长文
一文搞懂 Agents 评测丨Anthropic 最新万字长文Agent 并不是一次性输出的系统。它们运行在多轮交互之中:调用工具、修改内部状态、根据中间结果不断调整策略。也正是这些让 Agent 变得有用的能力 ——自主性、智能性与灵活性 —— 同时也让它们变得更难以评估。
Agent 并不是一次性输出的系统。它们运行在多轮交互之中:调用工具、修改内部状态、根据中间结果不断调整策略。也正是这些让 Agent 变得有用的能力 ——自主性、智能性与灵活性 —— 同时也让它们变得更难以评估。
在这场一年狂飙的亲历者之一——MCP 联合创作者、核心维护者 David Soria Parrra 看来,最戏剧性的分水岭发生在四月前后:当 Sam Altman、Satya Nadella、Sundar Pichai 先后公开表态,Microsoft、Google、OpenAI 都将采用 MCP,“大客户”突然从 Cursor、VS Code 扩散到整个行业。
近日,清华大学等机构的研究团队提出了 MARSHAL 框架。该框架利用强化学习,让大模型在策略游戏中进行自博弈(Self-Play)。实验表明,这种多轮、多智能体训练不仅提升了模型在游戏中的博弈决策水
清华大学智能产业研究院(AIR)联合清华大学生命学院、清华大学化学系在Science上发表论文:《深度对比学习实现基因组级别药物虚拟筛选》。团队研发了一个AI驱动的超高通量药物虚拟筛选平台DrugCLIP。
就在刚刚,Claude Code的核心开发者Boris在X平台上扔出了一个重磅炸弹。他们内部团队在使用的一个插件,叫 code-simplifier,直接开源了!我看了一下这个插件的功能和提示词,当时就兴奋了。
在传统企业中,市场调研往往是决策最慢的一环,从问卷设计到洞察输出要花上数周。Dialogue AI试图用AI自动化整个研究流程,让洞察生成的速度与产品迭代保持同步。它的出现不仅是效率的革新,更是企业理解用户方式的范式转变——让研究从被动响应变为实时驱动。
MIT天才博士一毕业,火速加盟OpenAI前CTO初创!最近,肖光烜(Guangxuan Xiao)在社交媒体官宣,刚刚完成了MIT博士学位。下一步,他将加入Thinking Machines,专注于大模型预训练的工作。
联想给出的公式是,混合AI=个人智能+企业智能+公共智能。这种模式下,AI智能体应用不再依赖于单一的云端模型,而是云端大模型与本地定制化小模型的深度融合。
Spangle 是一家由前 Bolt 首席执行官 Maju Kuruvilla 创办的 AI 电子商务初创公司,已在新一轮融资中筹集了 1500 万美元,公司投后估值达 1 亿美元。本轮完全股权性质的A 轮融资由 NewRoad Capital Partners 领投。一年多前,这家总部位于西雅图的初创企业以 3000 万美元投前估值完成了 600 万美元的种子轮融资 。
在今天(1 月 9 日)早上前往港交所敲钟前,MiniMax 创始人闫俊杰对《晚点 LatePost》分享了他此刻的想法:希望我们后续能有机会对整个行业智能水平的提升做出更大的贡献。我们初步探索了一条纯草根 AI 创业的路径,尽管后面还是非常挑战,如果能对 AI 创新创业生态的发展有启发我们会感到很光荣。