空间智能终极挑战MMSI-Video-Bench来了,顶级大模型全军覆没
空间智能终极挑战MMSI-Video-Bench来了,顶级大模型全军覆没空间理解能力是多模态大语言模型(MLLMs)走向真实物理世界,成为 “通用型智能助手” 的关键基础。但现有的空间智能评测基准往往有两类问题:一类高度依赖模板生成,限制了问题的多样性;另一类仅聚焦于某一种空间任务与受限场景,因此很难全面检验模型在真实世界中对空间的理解与推理能力。
来自主题: AI技术研报
7293 点击 2026-01-06 09:50