一种面向多人的眨眼与视线一体化检测模型构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向多人的眨眼与视线一体化检测模型构建方法
申请号:CN202410982935
申请日期:2024-07-22
公开号:CN118942145A
公开日期:2024-11-12
类型:发明专利
摘要
本发明属于计算机视觉领域,具体涉及一种面向多人的眨眼与视线一体化检测模型构建方法,眨眼与视线一体化检测网络包括:特征提取网络,用于提取RGB视频片段的高层语义特征Fv;查询器初始化模块,用于初始化N组实例级面部查询器和实例级眼部查询器以及每组对应的面部提议框和眼部提议框;查询器更新模块,用于实现面部与眼部查询器之间的空间交互并更新对应的特征;采用当前的每组面部查询器和眼部查询器,根据对应的面部提议框Pi和眼部提议框pi,从Fv中提取Pi、pi对应的局部特征,用以更新对应的查询器;多任务预测头用于实现对各个实例的人脸和人眼的定位与跟踪、眨眼区间检测、视线方向估计多个任务。本发明能提高多任务检测的精度与速度。
技术关键词
查询器 检测模型构建方法 一体化检测方法 面部 高层语义特征 动态滤波器 多任务 特征提取网络 视频 局部特征提取 多人脸 坐标 计算机视觉 注意力 图像 模块 标签 处理器 可读存储介质
系统为您推荐了相关专利信息
大语言模型 脚本 视频 音频 音效
护理系统 AR交互 医院PACS系统 智能监测机器人 患者用药依从性
照片人脸 人脸素描 语义先验 纹理特征 语义特征
自动化管理方法 企业考勤 像素点 直方图 面部
生成数字人 数据获取模块 风格 生成系统 情感特征