一种多模态非结构化内容关联检索方法

申请号：CN202510912421

申请日期：2025-07-03

公开号：CN120407839B

公开日期：2025-09-19

类型：发明专利

摘要

本发明公开了一种多模态非结构化内容关联检索方法，包括对多模态数据进行特征提取，得到不同模态下数据的特征；将多模态特征进行对齐，得到多模态对齐特征；对多模态对齐特征进行随机掩码，送入跨模态自注意力模型融合，得到掩码后的多模态融合特征向量；提取每一个图像的增强特征；通过交叉注意力网络对增强特征进行处理，得到不同图像之间的余弦相似度；进行图像特征的匹配，得到图像的关联结果；通过输入检索文本到语言大模型中得到文本特征，通过多模态数据嵌入空间，使用余弦相似度匹配出最相似的图像，得到图像的检索结果。本发明提高了多模态特征融合的准确性和稳定性，提高了图像检索的准确性和效率。

技术关键词

关联检索方法互补性特征图像跨模态样本注意力模型融合数据嵌入文本多模态特征融合融合特征更新模型参数对象度量网络可见光

系统为您推荐了相关专利信息

智能座舱多模态数据构建方法、系统、设备及存储介质

数据构建方法多模态智能座舱标签体系图像

一种空中加油锥套目标检测跟踪和位姿估计方法

空中加油锥套特征融合网络卡尔曼滤波修正位姿估计方法视频帧间

基于机器视觉的车底检测方法、系统、设备和存储介质

机器人峰值信噪比车辆车轮视觉三维点云数据

RIS辅助系统中基于相关性预测的时变信道估计方法及设备

信道估计卡尔曼滤波估计方法辅助系统状态空间模型

图像检测模型训练及图像检测方法、装置、设备和介质

图像检测模型特征提取网络分类网络聚类图像检测方法