
多模态推理新基准!最强Gemini 2.5 Pro仅得60分,复旦港中文上海AILab等出品
多模态推理新基准!最强Gemini 2.5 Pro仅得60分,复旦港中文上海AILab等出品逻辑推理是人类智能的核心能力,也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现,研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)
逻辑推理是人类智能的核心能力,也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现,研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)
能够完成多步信息检索任务,涵盖多轮推理与连续动作执行的智能体来了。通义实验室推出WebWalker(ACL2025)续作自主信息检索智能体WebDancer。
我们拆解AI Agent的运作流程,包括感知层、决策层和执行层。
AI Agent又解锁了一个领域!清华大学牵头,与西北工业大学以及上海AI lab等机构推出了电镜领域的AI agent——AutoMat。
就在刚刚,DeepMind科学家Jon Richens表示,自己的一篇ICML 2025论文发现,智能体就是世界模型!总之,如果要实现AGI,是绝对不存在无模型的捷径的。而这个说法,恰巧跟Ilya 23年的预言不谋而合了。
从国际象棋神童到诺贝尔奖得主,Hassabis正带领谷歌DeepMind追逐AGI梦想。AI正在颠覆职场,但Hassabis乐观地认为,AI不仅能提高生产力,创造新工作,还可能让人类不再自私!
如果要问近期最火热的AI硬件品类是什么,AI眼镜一定榜上有名。
大型语言模型 (LLM) 的发展日新月异,但实时「内化」与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时,能够自主决策获取外部知识的策略?
数学家出手反击AI!对AlphaEvolve在“集合和差问题”上的成果进一步改进。
上图本次发布直播的页面:ChatGPT for business。所以这是一个商业导向的更新,跟普通用户没啥大关系。本次共有两个更新,下面一个一个介绍它们。(别抱有太大希望)更新 1:Deep Research Connector