基于开集目标检测的关键点定位方法、设备和存储介质

申请号：CN202411679423

申请日期：2024-11-22

公开号：CN119169688B

公开日期：2025-04-04

类型：发明专利

摘要

本申请涉及一种基于开集目标检测的关键点定位方法、设备和存储介质，该方法包括：获取场景图像，通过开集目标检测网络检测出所述场景图像中所有的人脸，得到人脸图像；通过人脸质量检测网络将所述人脸图像划分为优质人脸图像和劣质人脸图像，以第一文本信息为依据，获取相似度最高的最终五官图像，通过预先训练好的人脸关键点定位网络对所述最终五官图像进行人脸关键点预测，得到第一人脸关键点；通过预先训练好的图像特征提取网络对所述劣质人脸图像进行特征提取图像特征，并通过训练好的线性层对所述图像特征进行预测，得到第二人脸关键点。本申请通过融合图像和文本等多模态数据的方式，提高了复杂场景下图片关键点定位的准确性和鲁棒性。

技术关键词

关键点定位方法人脸关键点定位图像特征提取视觉特征文本多模态特征融合场景数据线性特征提取网络处理器图文参数定位点可读存储介质

系统为您推荐了相关专利信息

车辆动力学仿真模型的建模方法、终端设备及介质

仿真模型建模方法子系统 Adams软件文本

基于大语言模型的径流预测方法和系统

径流预测方法深度学习模型大语言模型生成可执行代码水文

基于VITS的特征融合语音合成方法及装置

韵律特征多头注意力机制生成对抗网络深度学习模型神经网络模型

基于双重共享机制的小样本分类方法及系统

样本分类方法文本编码器瓶颈结构适配器机制

基于YTS引擎的车载终端数据处理方法、装置及电子设备

录像对象深度学习模型文本 Kalman滤波器