融合注意力机制的多标签图像识别方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
融合注意力机制的多标签图像识别方法及装置
申请号:CN202510216514
申请日期:2025-02-26
公开号:CN120147714A
公开日期:2025-06-13
类型:发明专利
摘要
本发明公开了一种融合注意力机制的多标签图像识别方法及装置,包括:获取多标签图像;对多标签图像进行预处理,得到预处理图像;提取预处理图像的局部特征和标签位置特征;根据局部特征和标签位置特征确定查询信息,计算查询信息中关键词的相关性,经softmax函数归一化得到权重,再计算加权和得到注意力值,确定关系特征;将注意力机制融入多标签图像类别识别模型中,将关系特征与局部特征融合,确定融合特征,并输入下一级网络进行信息传递,直至确定输出结果;根据输出结果和预设的分类阈值,确定预处理图像所属的多个类别标签。便于提高对多标签图像的分类效率及分类准确性。
技术关键词
融合注意力机制 图像识别方法 多标签图像 颜色直方图 像素点 分类阈值 关键词 融合特征 Softmax函数 局部图像特征 引入注意力机制 标记 关系 图像分割算法 通道