基于多模态大模型的表观缺陷检测方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态大模型的表观缺陷检测方法及系统
申请号:CN202510258419
申请日期:2025-03-06
公开号:CN119762485B
公开日期:2025-05-16
类型:发明专利
摘要
本发明公开了一种基于多模态大模型的表观缺陷检测方法及系统。首先,设计提示词,利用GPT‑4V自动标注缺陷图像来构建缺陷图像‑掩膜‑文字描述数据集;其次,利用此数据集微调预训练的大语言骨干网络,使其能更好地理解缺陷检测任务;然后,针对编码器各层视觉特征,设计了一种多视觉尺度token组机制,再利用轻量级掩膜解码器输出缺陷检测结果;最后,结合大语言骨干网络的文字描述输出,设计了一种结合缺陷检测掩膜和缺陷文字描述的缺陷检测算法,大幅提高了工业生产环境中的缺陷检测准确率。
技术关键词
表观缺陷检测方法 视觉特征 多模态 编码器 掩膜 解码器 缺陷检测算法 图像 工业生产环境 网络 多尺度 数据 多视觉 处理器 注意力 标签 存储装置
系统为您推荐了相关专利信息
场景分类 分区 训练样本数据 空间聚类算法 卷积神经网络模型
编码特征 视频帧 人体图像分割方法 图像编码 序列
定位方法 短时傅里叶变换 关键帧 计算机可读指令 教学
令牌 大语言模型 视觉特征 生成图像信息 图像解码器
视频智能剪辑方法 视觉显著性特征 多模态 动态时间规整算法 语音