AI资讯新闻榜单内容搜索-GAIA

开源万亿模型Ring-2.5-1T接管了我的终端，还给自己的大脑写了个实现

先介绍一下今天的主角。Ring-2.5-1T，蚂蚁百灵团队刚发布的万亿参数开源思考模型，全球首个混合线性注意力架构的万亿级选手。IMO 2025 国际奥数 35/42 拿到金牌水平，CMO 2025 中国奥数 105 分远超国家集训队线 87 分，GAIA2 通用 Agent 评测开源 SOTA。数字很漂亮，但数字谁都会贴。

来自主题: AI资讯

9243 点击 2026-02-13 23:30

Scaling Law的焦虑差距可以由「交互深度」解决，MiroMind用Qwen3-72B在GAIA中超越GPT5

在过去五年，AI领域一直被一条“铁律”所支配，Scaling Law（扩展定律）。它如同计算领域的摩尔定律一般，简单、粗暴、却魔力无穷：投入更多的数据、更多的参数、更多的算力，模型的性能就会线性且可预测地增长。无数的团队，无论是开源巨头还是商业实验室，都将希望孤注一掷地押在了这条唯一的救命稻草上。

来自主题: AI技术研报

6886 点击 2025-11-24 10:19

登顶Hugging Face GAIA全球榜首！中兴超级智能体终结「AI黑盒」时代

在杭州奥体中心演唱会现场，一套名为「Co-Sight 2.0」的AI系统成功保障了网络稳定，其背后是中兴通讯研发的、新近登顶Hugging Face GAIA全球权威榜单的超级智能体。

来自主题: AI资讯

8413 点击 2025-10-15 14:32

你的设想被证实了！不微调模型也能微调Agent，Memento霸榜GAIA｜UCL最新

你或许也有过这样的猜想，如何让AI智能体（Agent）变得更聪明、更能干，同时又不用烧掉堆积如山的算力去反复微调模型？

来自主题: AI技术研报

11477 点击 2025-09-01 09:58

深度｜Agent 全球爆发，Agent Infra是否是搭上这趟快车的关键？

京东云于今年 7 月正式开源了JoyAgent‑JDGenie，这是业内首个“完整产品级”通用多智能体系统——覆盖前端／后端／智能体框架／执行引擎以及众多子 Agent（如报告、代码、PPT 智能体）；在权威 GAIA 基准测试中取得 75.15% 整体准确率，，显著超越 OWL、OpenManus 等同类开源产品。

来自主题: AI资讯

8926 点击 2025-08-20 12:26

代季峰陈天桥联手AGI首秀炸场！最强开源深度研究模型，GAIA测试82.4分超OpenAI

最强开源深度研究模型来了。 MiroMind ODR（Open Deep Research），来自代季峰加盟陈天桥的技术首秀。首先，它做到了性能最强，GAIA测试结果更是达到了82.4分，超过了一众开源闭源模型，其中包括Manus、OpenAI的DeepResearch。

来自主题: AI资讯

9383 点击 2025-08-10 16:33

腾讯AI Lab开源即王炸：GAIA同级最强Agent框架

当AI智能体（Agent）开发的浪潮涌来，很多一线工程师却发现自己站在一个尴尬的十字路口：左边是谷歌、OpenAI等巨头深不可测的“技术黑盒”，右边是看似开放却暗藏“付费墙”的开源社区。大家空有场景和想法，却缺少一把能打开未来的钥匙。

来自主题: AI资讯

8069 点击 2025-08-07 11:04

Agent KB：经验池让Agents互相学习！GAIA新开源SOTA，Pass@1性能最高提升6.66

近日，来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索，让智能体能够从其他任务的成功经验中学习，显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报

9476 点击 2025-07-25 16:50

阿里发布信息检索Agent，可自主上网查资料，GAIA基准超越GPT-4o | 模型&数据开源

Agent能“看懂网页”，像人类一样上网？阿里发布WebDancer，就像它的名字一样，为“网络舞台”而生。

来自主题: AI技术研报

8326 点击 2025-06-27 15:54

开启 AI 自主进化时代，普林斯顿Alita颠覆传统通用智能体，GAIA榜单引来终章

智能体技术日益发展，但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流，这极大限制了其创造力、可扩展性与泛化能力。

来自主题: AI技术研报

8476 点击 2025-06-05 11:50