基于多模态大模型的表观缺陷检测方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
基于多模态大模型的表观缺陷检测方法及系统
申请号:
CN202510258419
申请日期:
2025-03-06
公开号:
CN119762485B
公开日期:
2025-05-16
类型:
发明专利
摘要
本发明公开了一种基于多模态大模型的表观缺陷检测方法及系统。首先,设计提示词,利用GPT‑4V自动标注缺陷图像来构建缺陷图像‑掩膜‑文字描述数据集;其次,利用此数据集微调预训练的大语言骨干网络,使其能更好地理解缺陷检测任务;然后,针对编码器各层视觉特征,设计了一种多视觉尺度token组机制,再利用轻量级掩膜解码器输出缺陷检测结果;最后,结合大语言骨干网络的文字描述输出,设计了一种结合缺陷检测掩膜和缺陷文字描述的缺陷检测算法,大幅提高了工业生产环境中的缺陷检测准确率。
技术关键词
表观缺陷检测方法
视觉特征
多模态
编码器
掩膜
解码器
缺陷检测算法
图像
工业生产环境
网络
多尺度
数据
多视觉
处理器
注意力
标签
存储装置
系统为您推荐了相关专利信息
1
一种边海地区复杂场景智能分类方法和系统
场景分类
分区
训练样本数据
空间聚类算法
卷积神经网络模型
2
人体图像分割方法和装置、电子设备及存储介质
编码特征
视频帧
人体图像分割方法
图像编码
序列
3
教学互动抢答定位方法、装置、计算机设备及存储介质
定位方法
短时傅里叶变换
关键帧
计算机可读指令
教学
4
一种针对多尺度可学习查询令牌的确值方法及装置
令牌
大语言模型
视觉特征
生成图像信息
图像解码器
5
一种基于多模态分析的短视频智能剪辑方法及系统
视频智能剪辑方法
视觉显著性特征
多模态
动态时间规整算法
语音