一种基于多尺度语义注意力机制的人物交互检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多尺度语义注意力机制的人物交互检测方法
申请号:CN202510392330
申请日期:2025-03-31
公开号:CN120259952A
公开日期:2025-07-04
类型:发明专利
摘要
本发明属于计算机视觉技术领域,聚焦于人物交互检测(HOI)任务。针对现有HOI检测方法在多尺度特征利用与远距离交互检测方面存在的不足,如CNN局部感受野限制全局语义捕捉、Transformer处理极端尺度差异易混淆特征等问题,提出一种基于多尺度语义注意力机制的人物交互检测方法。方法在Trans former模型主干特征提取网络引入基于PVT的多尺度融合模块,构建多级网络特征增强检测能力,将DETR检测结果进行语义特征建模,通过多尺度特征和交互语义特征改进Transformer解码器的注意力机制,自注意力解码交互语义特征、交叉注意力融合多尺度颗粒特征预测人物交互结果,实现了多尺度高准确度的人物交互检测方法。
技术关键词
交互检测方法 语义注意力 语义特征 特征提取网络 多级特征 编码 解码器 远距离交互 交叉注意力机制 多尺度特征融合 上采样 注意力解码 局部感受野
系统为您推荐了相关专利信息
网络状态分析方法 语义信息提取 特征提取单元 嵌入特征 终端设备
情感识别方法 语音情感识别模型 文本 数据 语音特征
语义注意力 注意力机制 分类系统 子模块 标签文本
语义特征提取 视觉特征提取 数值 展示方法 机器可读指令
碳化硅电炉 节能改造系统 编码向量 隐式特征 负压装置