摘要
本发明公开了一种基于多模态开集联想推理的变电站缺陷识别方法及系统,所述方法包括采集变电站油性设备缺陷图像并标注;构建图像‑文本匹配的多模态数据集;采用YOLOv8提取视觉特征,CLIP模型处理文本特征;设计重参数化视觉语言路径聚合网络进行特征融合;基于对比损失函数训练模型;通过多指标评估性能后部署应用;本发明通过多模态特征融合与重参数化路径聚合网络,有效解决了渗漏油缺陷因液体流动性与形态多变导致的标注困难问题,显著改善了多设备交叉干扰下的误检情况,结合多尺度特征学习与注意力机制,大幅提升了油污缺陷的识别准确性。