AI资讯新闻榜单内容搜索-Geometrica

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Geometrica

引入几何约束后，VLM跨越了「空间推理」的认知鸿沟

现有的视觉大模型普遍存在「语义-几何鸿沟」（Semantic-to-Geometric Gap），不仅分不清东南西北，更难以处理精确的空间量化任务。例如问「你坐在沙发上时，餐桌在你的哪一侧？」，VLM 常常答错。

来自主题: AI技术研报

6941 点击 2026-01-13 10:20