摘要
本发明公开了一种基于联邦视觉语言模型的遥感图像生成方法,属于机器学习技术领域,具体包括:各客户端接收文本指令描述;将私有遥感图像数据通过视觉编码器提取多尺度特征图,同时文本指令描述通过语言编码器生成语义嵌入向量;将语义嵌入向量与多尺度特征图输入动态注意力掩码生成器,生成像素级空间权重分布;对多尺度特征图进行加权融合操作,生成文本条件化的视觉特征表示;通过图像解码器生成符合文本指令描述的遥感图像;客户端向中央服务器上传视觉编码器、语言编码器及动态注意力掩码生成器的模型参数增量;中央服务器聚合模型参数增量,将更新后的全局模型参数分发至各客户端;本发明有效提升了遥感图像生成的灵活性与语义一致性。