摘要
本发明公开了一种基于大模型视觉提取的实时纸纤维智能分析系统,包括多模态融合模块,所述多模态融合模块包括图像编码器和文本编码器,所述图像编码器用于将输入的纸纤维图像按多个尺度进行切分,生成多组子图,并对不同尺度的子图进行特征向量化;所述文本编码器用于将与纸纤维相关的语义描述转化为文本特征;通过该模块实现视觉与语言的互补关系,提升纸纤维检测精度以及对复杂生产环境的适应能力。本发明相比传统依赖单一视觉信息的方法,极大地提高了对微小纤维特征的捕捉能力,有效提升纤维检测与分析的精度,减少检测误差与漏检情况,且通过持续迭代与增量学习,系统的知识储备与诊断能力不断提高。