基于AI数字人的行为预测方法、系统、设备及存储介质
申请号:CN202510267599
申请日期:2025-03-07
公开号:CN119762930B
公开日期:2025-09-19
类型:发明专利
摘要
本申请涉及一种基于AI数字人的行为预测方法、系统、设备及存储介质,该方法包括获取原始视觉数据、语音数据和环境传感数据,并进行初步预处理,得到处理数据集;从处理数据集中提取多模态特征,得到视觉特征、语音特征和环境感知特征,并基于注意力机制对各模态特征进行加权融合,生成多模态特征表示;基于多模态特征表示,采用深度学习模型进行遮挡补偿优化,识别并修复原始视觉数据中的遮挡区域,进而生成优化特征集;通过时序分析模型对优化特征集进行行为预测,生成与用户当前交互状态相关的行为输出。本申请具有提高行为预测效率的效果。
技术关键词
多模态特征
注意力机制
深度学习模型
跨模态
深度卷积神经网络
感知特征
子模块
语音特征
邻域特征
视觉特征
时序特征
交互性
数据
矩阵
生成对抗网络
特征提取模块