摘要
本发明公开了基于大数据的图文检索方法及系统,本发明涉及数据处理技术领域,解决了缺乏根据数据特点和用户需求动态调整筛选条件的能力,无法充分挖掘图文之间的内在联系,难以精准匹配用户需求的技术问题,本发明通过对图像信息提取颜色、纹理、形状等多维度特征,对文本信息采用词袋模型提取特征,实现了对图文信息的深度挖掘,能更全面地代表图文的本质特征,提高了检索的精准度,进行单一匹配、关联度计算筛选,再进行二次匹配,文本特征与图像特征匹配结果进一步结合筛选,最后对组合检索结果再次进行匹配筛选,多层级的筛选机制能有效排除不相关信息,从海量数据中精准定位符合要求的图文,大大提高了检索结果的质量。