一种基于多模态智能排序的方法

申请号：CN202510407102

申请日期：2025-04-02

公开号：CN119903212A

公开日期：2025-04-29

类型：发明专利

摘要

本发明公开了一种基于多模态智能排序的方法，所述方法利用多模态模型对查询图片进行编码，生成查询图片向量；利用所述查询图片向量到向量库查询相似图片；通过多模态模型Qwen2‑VL生成查询图片的语义文本向量，以及结果图片的语义文本向量；通过智能排序算法分别计算结果图片与查询图片的图片相似度及文本相似度，综合图片相似度与语义相似度对结果图片进行综合排序。本发明提取图片中的重点语义信息，去除图片中的不相关干扰项，将图像的语义信息视为重要权重进行排序优化，让整体排序更聚焦在核心内容，提高了检索结果的相关性和准确性。

技术关键词

图片多模态文本语义生成方式排序算法注意力计算机程序产品可读存储介质存储计算机程序像素编码矩阵彩色图像处理器数值对象数据