一种基于去偏变分推断提示调优的图像识别方法

申请号：CN202510012396

申请日期：2025-01-06

公开号：CN119418137B

公开日期：2025-03-18

类型：发明专利

摘要

本发明公开了一种基于去偏变分推断提示调优的图像识别方法，属于人工智能和计算机视觉领域。本发明将CLIP作为基准框架，该基准框架包括一个图像分支、一个文本分支；本发明基于图像分支，设计一种基于风格扰动的图像编码器，获得去偏的视觉特征；基于去偏的视觉特征和文本分支，设计一种基于去偏变分推断的文本编码器，获得去偏的文本特征；并通过设计的一种基于变分推断的损失函数，将训练集数据通过基于变分推断的损失函数最小化优化模型参数，得到参数最优的模型；将测试图像数据输入参数最优的模型得到图像识别结果。本发明为数据稀缺或受限场景提供了一种通用的小样本图像识别方法，在有限数据下仍能保持较高的识别准确率和泛化性能。

技术关键词

训练图像数据令牌视觉特征图像编码器图像识别方法文本编码器风格分支压缩图像数据训练集数据参数样本基准图像块框架标签

系统为您推荐了相关专利信息

一种基于思维链的软件漏洞自动修复方法及存储介质

漏洞自动修复方法程序令牌前馈神经网络软件

一种全模态有害信息的识别方法、装置及电子设备

有害信息识别三元组模态特征自然语言理解模型视觉特征

一种基于扩散模型可推广的布局到图像生成方法

注意力地图布局特征图像生成方法语义噪声图像

一种基于视觉大模型的鱼类图像分割方法及系统

图像分割方法图像分割模型图像轮廓信息视觉图像编码器

一种基于心脏超声影像的病灶定位方法

心脏异常点病灶定位方法矩阵高斯模糊图像