AI资讯新闻榜单内容搜索-GAIA

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GAIA
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI

代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI

代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI

最强开源深度研究模型来了。 MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。 首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。

来自主题: AI资讯
5996 点击    2025-08-10 16:33
腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

当AI智能体(Agent)开发的浪潮涌来,很多一线工程师却发现自己站在一个尴尬的十字路口:左边是谷歌、OpenAI等巨头深不可测的“技术黑盒”,右边是看似开放却暗藏“付费墙”的开源社区。大家空有场景和想法,却缺少一把能打开未来的钥匙。

来自主题: AI资讯
5371 点击    2025-08-07 11:04
Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

近日,来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索,让智能体能够从其他任务的成功经验中学习,显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报
7114 点击    2025-07-25 16:50
开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可扩展性与泛化能力。

来自主题: AI技术研报
6214 点击    2025-06-05 11:50
AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

这次,引领者又是中国公司!在5月中旬拿到GAIA榜首的这个AI版office,直接结合了Deep Research和通用Agent两大神器的优点,从此office三件套彻底进入第四代。

来自主题: AI资讯
4952 点击    2025-05-23 12:32
OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

CAMEL-AI 团队在 Manus 上线后 1 天内推出的 OWL 就是其中最具代表性的一个,项目实测成绩达到开源界 GAIA 性能天花板,达到了 58.18%,超越 Huggingface 提出的 Open Deep Research 55.15% 的表现。

来自主题: AI资讯
8022 点击    2025-03-29 09:57
3天后,我觉得可以再来聊聊Manus了。

3天后,我觉得可以再来聊聊Manus了。

3天后,我觉得可以再来聊聊Manus了。

甚至很多人嘲讽,国外的论坛和自媒体还没动静,只有国内AI自媒体吹,所以一定都是收钱的营销号。那现在,海外热度开始爆了,是不是也都收钱了?

来自主题: AI资讯
9180 点击    2025-03-10 11:53
解构Manus AI:这是通用Agent革命,还是精巧缝合怪?

解构Manus AI:这是通用Agent革命,还是精巧缝合怪?

解构Manus AI:这是通用Agent革命,还是精巧缝合怪?

自媒体的反应堪称狂热:“通用Agent终于实现了!”“这是继DeepSeek之后的又一技术革命!”这样夸张的赞誉随处可见。从Benchmark来看,它的表现确实非常亮眼,在GAIA测试中超越了之前的各种Agent以及OpenAI的DeepResearch。

来自主题: AI技术研报
8214 点击    2025-03-09 02:07