一种基于多模态的头部姿态校正凝视方向估计方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于多模态的头部姿态校正凝视方向估计方法
申请号:
CN202510245210
申请日期:
2025-03-03
公开号:
CN120340083A
公开日期:
2025-07-18
类型:
发明专利
摘要
本发明涉及图像处理与模式识别技术领域,具体涉及一种基于多模态的头部姿态校正凝视方向估计方法,该方法包括:步骤1,对凝视估计数据集进行预处理并划分为训练集和测试集;步骤2,构建基于多模态的头部姿态校正凝视方向估计模型;步骤3,将训练集中的双眼图像和人脸图像作为输入,训练基于多模态的头部姿态校正凝视方向估计模型;步骤4,利用训练好的凝视方向估计模型预测测试集数据。本发明显著地提升凝视方向估计的性能,改善了用户在虚拟现实和人机交互领域的体验,为用户提供了更智能、更自然的交互方式。
技术关键词
姿态校正
多模态
估计方法
多层感知器
人脸模型
图像
面部关键点
代表
注意力机制
定义
卷积神经网络模块
人脸关键点定位
姿态特征
伽马校正方法
残差网络
像素
透视变换矩阵
系统为您推荐了相关专利信息
1
一种复合机器人多模态数据加密传输方法、系统及终端
复合机器人
数据加密传输方法
声音检测信息
多模态
参数
2
一种生成动画及视频的系统、方法、设备和存储介质
动画生成系统
生成动画
动画生成方法
数据处理引擎
时序预测模型
3
一种整合光学显微与实时诊断的牙科工作台系统
工作台系统
信息采集模块
图像获取单元
分析模块
撑开单元
4
一种基于多模态超声及心电图的无创性冠状动脉狭窄检测系统和方法
多模态
指数
风险
心脏
轮廓图像
5
一种基于人工智能的视网膜脉络膜病程结构变化监测系统
光学相干断层扫描
彩色影像数据
特征提取单元
三维卷积神经网络
梯度提升决策树