一种基于人脑情景记忆通路启发的文本视频检索方法

申请号：CN202510416357

申请日期：2025-04-03

公开号：CN119938985B

公开日期：2025-07-01

类型：发明专利

摘要

本发明公开了一种基于人脑情景记忆通路启发的文本视频检索方法，方法包括利用内容编码组件对目标文本数据或目标视频数据进行内容表征提取获得多尺度目标表征；利用情境编码组件对目标文本数据或目标视频数据进行情境表征提取获得目标令牌；将多尺度目标表征和目标令牌输入至双曲图神经网络获得目标场景表征；将目标场景表征作为目标索引；计算待检索文本或视频的表征与目标索引的相似度，根据相似度对待检索文本或视频进行筛选获得目标检索结果；本发明通过多粒度信息融合全面捕捉的多层次语义特征，通过双曲图卷积操作融合多模态、多粒度的高阶信息，能够更好地捕捉文本和视频之间的复杂关系，显著提升了文本视频检索的精度与效率。

技术关键词

令牌节点特征视频检索方法神经网络架构多层感知机文本编码器融合特征场景视觉感知特征数据注意力双曲正切函数多层次语义特征

系统为您推荐了相关专利信息

基于深度多模态学习的智能化交互问答方法及系统

文本特征向量图像特征向量意图识别多模态交互节点特征

面向多层颜色特征的密集复用与跳跃连接的水下图像增强方法

水下图像增强方法卷积模块引入注意力机制图像增强模型通道

基于提示学习与自适应Mamba门控选择融合跨模态哈希检索方法

跨模态图文全局平均池化融合特征特征提取模块

高动态网络下的无人机资源调度方法、装置、设备及介质

资源调度模型无人机资源调度方法多头注意力机制距离信息