一种多模态非结构化内容关联检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态非结构化内容关联检索方法
申请号:CN202510912421
申请日期:2025-07-03
公开号:CN120407839B
公开日期:2025-09-19
类型:发明专利
摘要
本发明公开了一种多模态非结构化内容关联检索方法,包括对多模态数据进行特征提取,得到不同模态下数据的特征;将多模态特征进行对齐,得到多模态对齐特征;对多模态对齐特征进行随机掩码,送入跨模态自注意力模型融合,得到掩码后的多模态融合特征向量;提取每一个图像的增强特征;通过交叉注意力网络对增强特征进行处理,得到不同图像之间的余弦相似度;进行图像特征的匹配,得到图像的关联结果;通过输入检索文本到语言大模型中得到文本特征,通过多模态数据嵌入空间,使用余弦相似度匹配出最相似的图像,得到图像的检索结果。本发明提高了多模态特征融合的准确性和稳定性,提高了图像检索的准确性和效率。
技术关键词
关联检索方法 互补性特征 图像 跨模态 样本 注意力模型融合 数据嵌入 文本 多模态特征融合 融合特征 更新模型参数 对象 度量 网络 可见光
系统为您推荐了相关专利信息
数据构建方法 多模态 智能座舱 标签体系 图像
空中加油锥套 特征融合网络 卡尔曼滤波修正 位姿估计方法 视频帧间
机器人 峰值信噪比 车辆车轮 视觉 三维点云数据
信道估计 卡尔曼滤波 估计方法 辅助系统 状态空间模型
图像检测模型 特征提取网络 分类网络 聚类 图像检测方法