AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据
AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据还在用搜索和规则训练AI游戏?现在直接「看回放」学打宝可梦了!德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体,不靠规则、没用启发式算法,纯靠47.5万场人类对战回放训练出来,居然打上了Pokémon Showdown全球前10%!
还在用搜索和规则训练AI游戏?现在直接「看回放」学打宝可梦了!德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体,不靠规则、没用启发式算法,纯靠47.5万场人类对战回放训练出来,居然打上了Pokémon Showdown全球前10%!
OpenAI首席财务官Sarah Friar探讨了通往AGI的发展路径,目前OpenAI已到达第三阶段:智能体(Agent)。除Operator和深度研究Deep Research智能体外,OpenAI即将发布全球最强编程智能体。
这是一份报告,有关英伟达50系显卡。非常高质量,AI 一键出的
Two Heads are Better Than One"(两个脑袋比一个好/双Agent更优)源自英语中的一句古老谚语。MAS-TTS框架的研究者将这一朴素智慧应用到LLM中,创造性地让多个智能体协同工作,如同专家智囊团。
经历了 2025 年初 DeepSeek、Manus 们的冲击,大厂正在重新明确自己下一步的战略。
在生成式AI和多智能体系统迅速发展的当下,谁能率先解决“可信度”和“可控性”问题,谁就能真正把AI带入生产级别的商业落地。英国AI创业公司 Portia AI,正是在这个方向上突围的代表。
高德地图正式宣布,推出全球首个基于地图的AI导航智能体(NaviAgent),应用创新技术理念和架构,推动导航这一历史悠久的服务,由传统出行工具,向“会思考、能预判、有温度”的智能出行伙伴蜕变。
多智能体系统分布式共识优化的一系列研究来了!
在今天凌晨1点的产品发布中,OpenAI还开源了一个终端轻量级代码Agent智能体——Codex CLI。
谁掌握了 AI 体验、开发者和生态,谁就掌握了智能体 AI 时代的主动权。