大模型驱动的时空特征与文本增强少样本动作捕捉方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大模型驱动的时空特征与文本增强少样本动作捕捉方法
申请号:CN202510388665
申请日期:2025-03-31
公开号:CN119903479B
公开日期:2025-06-13
类型:发明专利
摘要
本发明公开大模型驱动的时空特征与文本增强少样本动作捕捉方法,属于动作捕捉技术领域,用于视频动作捕捉,包括获取视频数据并进行预处理,所述视频数据包括待进行动作捕捉的查询视频数据和带有动作标签的支持集视频数据,将预处理后的视频数据输入视觉编码器中,得到视频数据的视觉特征;综合两次类别概率分布,得出查询视频数据的动作捕捉结果。本发明通过时序增强适配器和时空融合适配器实现高效时空特征提取,增强了视频特征的时空建模能力;利用多层次注意力机制,提升了文本与视频特征的融合能力,构建了具有强泛化能力的类原型;在少样本学习任务中显著提升了模型的捕捉准确率,可训练参数量少,降低了计算成本。
技术关键词
动作捕捉方法 视觉特征 视频 适配器 数据 原型 前馈神经网络 样本 动作捕捉技术 文本编码器 时序 多层感知器 标签 注意力机制 超参数 多层次 上采样 模块
系统为您推荐了相关专利信息
光纤水听器阵列 水下声呐 光纤布拉格光栅传感器 光纤水听器单元 智能识别模块
区块链部署方法 节点 区块链平台 点对点 数据存储
人声 转换方法 音频 音色特征 语义特征
观测装置 三维变形场 观测方法 无线传输模块 积分算法
网络 动作识别模型 输入端 输出端 缺陷类别