一种基于跨模态交互感知的多模态图像融合方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于跨模态交互感知的多模态图像融合方法及系统
申请号:CN202510280466
申请日期:2025-03-11
公开号:CN119810606B
公开日期:2025-06-06
类型:发明专利
摘要
本发明公开了一种基于跨模态交互感知的多模态图像融合方法及系统,构建多模态图像融合模型并训练,将待融合的多模态图像输入训练后的多模态图像融合模型处理,编码器模块接收待融合的多模态图像并进行逐层编码处理,输出若干层不同尺度的特征图,通道级校正模块接收若干层不同尺度的特征图并进行加权校正,输出若干层权校正后的模态特征,动态跨模态交互模块接收若干层加权校正后的模态特征并处理,得到若干层融合特征,解码器模块接收若干层融合特征并进行逐层解码与融合处理,输出待融合的多模态图像对应的融合图像。该方法通过通道级校正模块和动态跨模态交互模块,能够有效地将多模态数据之间的相关信息进行交互。
技术关键词
图像融合方法 编码器模块 跨模态 通道校正 融合特征 校正模块 计算机系统 模态特征 动态 解码器 图像采集模块 多模态 编码块 图像融合系统
系统为您推荐了相关专利信息
图像识别方法 深度学习模型 照度 积层 Gabor滤波器
动作检测方法 细粒度特征 跨模态 文本 注意力
图像融合方法 多尺度卷积神经网络 分水岭算法 注意力 门模块
决策生成方法 时序特征 多模态 记忆 推理网络
融合特征 频谱特征 音频特征 多尺度特征 多层感知机