摘要
本申请提供基于自注意力机制的航空林火图像识别方法,包括以下步骤:获取林火视频为数据源;通过预处理方法筛选出图像,构建林火图像数据集,同时运用数据增强技术,丰富数据多样性,提高模型泛化能力;在特征提取阶段选用10层ViT作为主干网络,采用交叠滑动窗格方式图像序列化,嵌入位置信息后作为第1层ViT的输入,将前9层ViT提取的区域选择模块通过多头自注意力机制和多层感知器机制批量嵌入第10层ViT,有效放大子图间的微差异以获取小目标特征;采用对比特征学习策略,构建目标损失函数进行模型训练,获得图像类别标签,有效提高模型的特征学习能力和识别准确率。本申请利用机器学习技术提高航空林火图像识别的准确率和鲁棒性。