AI看图一本正经胡说八道?「一拉一推」让模型看得全又准|微软x清华
AI看图一本正经胡说八道?「一拉一推」让模型看得全又准|微软x清华随着视觉-语言模型(VLM)推理能力不断增强,一个隐蔽的问题逐渐浮现: 很多错误不是推理没做好,而是“看错了”。
来自主题: AI技术研报
7381 点击 2026-02-09 14:56
随着视觉-语言模型(VLM)推理能力不断增强,一个隐蔽的问题逐渐浮现: 很多错误不是推理没做好,而是“看错了”。
只需一组公开的prompt,ChatGPT看图猜地点的能力又科幻般进化了!
在社交媒体上发照片要谨慎了,AI工具一眼就能识破你的位置!