
零开销,消除图像幻觉!基于零空间投影挖掘正常样本特征 | CVPR 2025
零开销,消除图像幻觉!基于零空间投影挖掘正常样本特征 | CVPR 2025当前大型视觉语言模型(LVLMs)存在物体幻觉问题,即会生成图像中不存在的物体描述。
来自主题: AI技术研报
8171 点击 2025-06-27 16:26
当前大型视觉语言模型(LVLMs)存在物体幻觉问题,即会生成图像中不存在的物体描述。
武汉大学等发布了一篇大型视觉语言模型(LVLMs)安全性的综述论文,提出了一个系统性的安全分类框架,涵盖攻击、防御和评估,并对最新模型DeepSeek Janus-Pro进行了安全性测试,发现其在安全性上存在明显短板。
近年来,视觉大模型(Large Vision Language Models, LVLMs)领域经历了迅猛的发展,这些模型在图像理解、视觉对话以及其他跨模态任务中展现出了卓越的能力。然而,随着 LVLMs 复杂性和能力的增长,「幻觉现象」的挑战也日益凸显。
一个5月份完成训练的大模型,无法对《黑神话·悟空》游戏内容相关问题给出准确回答。