一种基于多级交互的无监督跨模态哈希检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多级交互的无监督跨模态哈希检索方法
申请号:CN202510359164
申请日期:2025-03-25
公开号:CN120296192A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种基于多级交互的无监督跨模态哈希检索方法,属于跨模态哈希检索技术领域,主要包括以下步骤:跨模态数据预处理;构建基于多级交互的无监督跨模态哈希检索网络;网络训练:将图像‑文本训练样本分批次输入到构建的网络中进行网络训练;模态检索:将图像‑文本的查询样本集和检索样本集输入训练完成的基于多级交互的无监督跨模态哈希检索网络中,分别生成对应的哈希码,通过计算查询样本和检索样本哈希码间的汉明距离得到查询结果,汉明距离最小者即为最终的查询结果。本发明能将高维的多模态特征压缩为紧致的二进制码,显著提升了跨模态检索效率,可用于实时图像搜索和跨模态推荐系统。
技术关键词
文本 汉明距离 随机梯度下降 模块 非暂态计算机可读存储介质 重构误差 语义 注意力机制 跨模态数据 图像特征提取 特征提取网络 处理器 特征提取器 检索技术 训练样本集