基于多模态多尺度自适应数据融合的遥感大模型性能提升方法
申请号:CN202511512509
申请日期:2025-10-22
公开号:CN120995410A
公开日期:2025-11-21
类型:发明专利
摘要
本申请提供了一种基于多模态多尺度自适应数据融合的遥感大模型性能提升方法,涉及遥感图像大语言模型技术领域。该方法基于开源的视觉通用语言模型重新改写网络结构,通过加入用于实现多模态融合和多尺度自适应的MFAM‑SPP层,得到性能提升的遥感大模型,并明确ViT、MFAM‑SPP、BERT、Q‑Former间的数据流与维度转换逻辑,在不过多降低速度的情况下,提升对多模态处理能力和多尺度目标检测能力,对整体模型的精度大幅提升。
技术关键词
多模态
遥感图像数据
性能提升方法
跨模态
文本特征向量
三通道
注意力
矩阵
筛选系统
多尺度
融合特征
轻量级卷积神经网络
动态
视觉
性能提升装置
池化特征
模态特征
空间结构特征