一种基于多尺度语义注意力机制的人物交互检测方法

申请号：CN202510392330

申请日期：2025-03-31

公开号：CN120259952A

公开日期：2025-07-04

类型：发明专利

摘要

本发明属于计算机视觉技术领域，聚焦于人物交互检测(HOI)任务。针对现有HOI检测方法在多尺度特征利用与远距离交互检测方面存在的不足，如CNN局部感受野限制全局语义捕捉、Transformer处理极端尺度差异易混淆特征等问题，提出一种基于多尺度语义注意力机制的人物交互检测方法。方法在Trans former模型主干特征提取网络引入基于PVT的多尺度融合模块，构建多级网络特征增强检测能力，将DETR检测结果进行语义特征建模，通过多尺度特征和交互语义特征改进Transformer解码器的注意力机制，自注意力解码交互语义特征、交叉注意力融合多尺度颗粒特征预测人物交互结果，实现了多尺度高准确度的人物交互检测方法。

技术关键词

交互检测方法语义注意力语义特征特征提取网络多级特征编码解码器远距离交互交叉注意力机制多尺度特征融合上采样注意力解码局部感受野

系统为您推荐了相关专利信息

网络状态分析方法和装置、设备及介质

网络状态分析方法语义信息提取特征提取单元嵌入特征终端设备

基于人工智能的情感识别方法、装置、计算机设备及介质

情感识别方法语音情感识别模型文本数据语音特征

一种基于标签语义对比融合感知的智能公文分类系统

语义注意力注意力机制分类系统子模块标签文本

一种实验结果评测展示方法及装置

语义特征提取视觉特征提取数值展示方法机器可读指令

一种石英砂制备碳化硅电炉的节能改造系统及方法

碳化硅电炉节能改造系统编码向量隐式特征负压装置