一种基于频域解耦和视觉Mamba的深度哈希图像检索方法
申请号:CN202410809515
申请日期:2024-06-21
公开号:CN118820508A
公开日期:2024-10-22
类型:发明专利
摘要
本发明公开了一种基于频域解耦和视觉Mamba的深度哈希图像检索方法,主要涉及深度哈希图像检索领域;包括步骤:S1、将图像数据集及其所对应的类别标签信息分成训练集、测试集和检索集;S2、构建基于频域解耦和视觉Mamba的深度哈希图像检索架构;S3、训练模型;S4、将测试集和检索集图片输入模型;S5、计算哈希码与检索集哈希码之间的汉明距离;S6、将汉明距离向量中的数值排序;S7、重复S5与S6操作,得到测试集中每张图像的检索结果,计算平均检索精度评估模型性能;本发明实现了对特征的频域解耦,并自适应的增强不同层级特征信息所匮乏的频域分量,充分挖掘图像的底层语义信息,生成更加紧凑和强区分度的哈希码。
技术关键词
深度哈希
汉明距离
视觉
特征融合网络
掩码矩阵
图像检索模型
状态空间模型
频域特征
滤波器
二维离散余弦变换
阶段
空间模块
分支
序列
高斯概率模型
预测图像数据
标签