基于自注意力机制的航空林火图像识别方法

申请号：CN202410821515

申请日期：2024-06-24

公开号：CN118736299A

公开日期：2024-10-01

类型：发明专利

摘要

本申请提供基于自注意力机制的航空林火图像识别方法，包括以下步骤：获取林火视频为数据源；通过预处理方法筛选出图像，构建林火图像数据集，同时运用数据增强技术，丰富数据多样性，提高模型泛化能力；在特征提取阶段选用10层ViT作为主干网络，采用交叠滑动窗格方式图像序列化，嵌入位置信息后作为第1层ViT的输入，将前9层ViT提取的区域选择模块通过多头自注意力机制和多层感知器机制批量嵌入第10层ViT，有效放大子图间的微差异以获取小目标特征；采用对比特征学习策略，构建目标损失函数进行模型训练，获得图像类别标签，有效提高模型的特征学习能力和识别准确率。本申请利用机器学习技术提高航空林火图像识别的准确率和鲁棒性。

技术关键词

嵌入位置信息林火图像多层感知器图像识别方法图像类别标签样本图像分割图像全局信息批量模块分割方法多头注意力机制航空滑动窗口模拟无人机细粒度特征

系统为您推荐了相关专利信息

一种基于去偏变分推断提示调优的图像识别方法

训练图像数据令牌视觉特征图像编码器图像识别方法

一种基于神经网络算法和视觉传感计算的图像识别方法及系统

图像传感阵列图像识别方法矩阵神经网络算法图像传感器

变压器绕组故障检测方法、装置、电子设备及存储介质

融合特征特征提取模型电流变压器绕组形变特征提取模块

一种教育智能化学习路径推荐系统

学习路径推荐方法机器学习模型学习路径推荐系统文本心率

基于图像高光谱技术的煤矸及煤质智能分选方法与系统

高光谱技术纹理特征分选方法声波特征图像