一种基于视觉语言大模型的运动层级解耦表征与分析方法及应用
申请号:CN202511031254
申请日期:2025-07-25
公开号:CN120912844A
公开日期:2025-11-07
类型:发明专利
摘要
本发明提供一种基于视觉语言大模型的运动层级解耦表征与分析方法及应用,包括以下步骤:S1:构建基于大语言模型的文本编码器、运动编码器,进行多模态特征对齐;S2:构建运动层级表征,并基于高阶贝塞尔曲线对枢纽关节点运动轨迹进行参数化表示;S3:对骨架进行图结构建模,其将骨架的生成建模为边连接确定条件下的图节点特征变换,构建文本‑骨架图序列‑枢纽关节点轨迹贝塞尔参数的三元样本对;S4:构建运动解码器,包括基于高阶贝塞尔表征的轨迹生成器和基于图结构的骨架生成器,并训练模型。本发明针对运动生成中特征空间到运动序列映射求解空间过大以及误差累积问题,提出了基于层级意图引导下的运动合成方法,有效提升了运动生成精度。
技术关键词
关节点
分析方法
节点特征
层级
文本编码器
视觉
大语言模型
序列
多模态特征
解码器
控制点
解码模型
运动编码器
轨迹生成器
身体
运动骨架
特征提取模型