摘要
本申请涉及一种基于开集目标检测的关键点定位方法、设备和存储介质,该方法包括:获取场景图像,通过开集目标检测网络检测出所述场景图像中所有的人脸,得到人脸图像;通过人脸质量检测网络将所述人脸图像划分为优质人脸图像和劣质人脸图像,以第一文本信息为依据,获取相似度最高的最终五官图像,通过预先训练好的人脸关键点定位网络对所述最终五官图像进行人脸关键点预测,得到第一人脸关键点;通过预先训练好的图像特征提取网络对所述劣质人脸图像进行特征提取图像特征,并通过训练好的线性层对所述图像特征进行预测,得到第二人脸关键点。本申请通过融合图像和文本等多模态数据的方式,提高了复杂场景下图片关键点定位的准确性和鲁棒性。