一种基于联邦视觉语言模型的遥感图像生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于联邦视觉语言模型的遥感图像生成方法
申请号:CN202510724762
申请日期:2025-06-03
公开号:CN120635237A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种基于联邦视觉语言模型的遥感图像生成方法,属于机器学习技术领域,具体包括:各客户端接收文本指令描述;将私有遥感图像数据通过视觉编码器提取多尺度特征图,同时文本指令描述通过语言编码器生成语义嵌入向量;将语义嵌入向量与多尺度特征图输入动态注意力掩码生成器,生成像素级空间权重分布;对多尺度特征图进行加权融合操作,生成文本条件化的视觉特征表示;通过图像解码器生成符合文本指令描述的遥感图像;客户端向中央服务器上传视觉编码器、语言编码器及动态注意力掩码生成器的模型参数增量;中央服务器聚合模型参数增量,将更新后的全局模型参数分发至各客户端;本发明有效提升了遥感图像生成的灵活性与语义一致性。
技术关键词
图像生成方法 语言编码器 编码向量 注意力 文本 客户端 图像解码器 描述符 视觉特征 语义 参数 多尺度特征 热力图 遥感图像数据 分辨率提升 动态 二值化阈值 指令 对象
系统为您推荐了相关专利信息
同步相量数据 故障传播路径 节点特征 配电网故障 注意力
结构化场景 语义 视频理解方法 生成代表 序列
重识别方法 特征提取网络 照片 行人特征 跨模态
子模块 知识图谱构建 深度学习模型 实体 自然语言
联合特征提取 跨模态 Apriori算法 多源异构数据融合 可视化控制台