图文匹配方法、装置、设备、存储介质及计算机程序产品
申请号:CN202511509696
申请日期:2025-10-22
公开号:CN120997624A
公开日期:2025-11-21
类型:发明专利
摘要
本申请涉及计算机技术领域,公开了一种图文匹配方法、装置、设备、存储介质及计算机程序产品,该方法包括:响应于输入的查询文本,将查询文本输入预设图文匹配模型,通过预设图文匹配模型分别提取候选图像的图像特征和查询文本的文本特征,预设图文匹配模型为基于文本模内对比损失进行细粒度对齐训练获得的模型,基于文本模内对比损失的细粒度对齐训练用于增强模型对语义相似文本的区分能力,基于图像特征和文本特征确定与查询文本匹配的目标图像;由于本申请预先基于文本模内对比损失对图文匹配模型进行细粒度对齐训练,以增强模型对语义相似文本的区分能力,从而能够提升图文匹配过程中细粒度匹配的精度,进而能够提高图文匹配的准确性。
技术关键词
图文匹配方法
文本
计算机程序产品
图像
匹配设备
视觉特征
语义特征
数据
处理器
样本
特征提取模块
匹配模块
跨模态
输入模块
存储器
编码
主题