摘要
本发明提供了一种基于双通路的遥感图像开放词汇有向目标检测方法。首先,通过同时冻结图像编码器和文本编码器来提取输入图像的多模态特征,最大限度地保留预训练模型对遥感图像特征的强表征能力,避免因任务数据偏差导致知识丢失;其次,设计了多尺度特征提取网络和类别无关有向候选框生成网络,前者能够缓解遥感图像中普遍存在的尺度差异问题,后者则通过类别无关的候选框学习确保网络对目标类的泛化能力;最后,构建了双通路检测网络实现基类和目标类在特征层面和分类任务的双解耦,避免基类与目标类特征共用导致的特征学习混淆。本发明能够在实现较优的遥感图像新类检测效果的同时保持较高的基类检测精度。