基于内嵌稀疏门专家混合模型的图文跨模态检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于内嵌稀疏门专家混合模型的图文跨模态检索方法
申请号:CN202511485569
申请日期:2025-10-17
公开号:CN120950724A
公开日期:2025-11-14
类型:发明专利
摘要
本发明属于跨模态图文检索技术领域,公开了基于内嵌稀疏门专家混合模型的图文跨模态检索方法,包括以下步骤:跨模态多尺度建模:利用空洞空间金字塔池化模块ASPP提取图像的多尺度图像特征,利用多尺度激活因子动态加权文本特征,实现图文跨模态多尺度语义对齐;多尺度跨模态特征融合:设计多尺度跨模态路由器,通过交叉注意力融合图像与文本特征,并通过专家网络分尺度提取跨模态联合特征;双路三元组损失计算:采用双路三元组损失函数,结合尺度内与跨尺度约束优化特征空间,实现多尺度与跨模态层面的联合优化,得到最终的跨模态检索结果。通过本发明提高跨模态图文检索的精度和效率。
技术关键词
三元组损失函数 空间金字塔池化 跨模态图文检索 文本 交互特征 图像多尺度 语义 模态特征 生成多尺度 空洞 交叉注意力机制 因子 路由器