摘要
本发明公开了一种基于多模态智能排序的方法,所述方法利用多模态模型对查询图片进行编码,生成查询图片向量;利用所述查询图片向量到向量库查询相似图片;通过多模态模型Qwen2‑VL生成查询图片的语义文本向量,以及结果图片的语义文本向量;通过智能排序算法分别计算结果图片与查询图片的图片相似度及文本相似度,综合图片相似度与语义相似度对结果图片进行综合排序。本发明提取图片中的重点语义信息,去除图片中的不相关干扰项,将图像的语义信息视为重要权重进行排序优化,让整体排序更聚焦在核心内容,提高了检索结果的相关性和准确性。