一种基于深度学习加速核的缩放算子计算方法

申请号：CN202510448639

申请日期：2025-04-10

公开号：CN120297345A

公开日期：2025-07-11

类型：发明专利

摘要

本发明涉及神经网络处理器NPU，具体涉及一种基于深度学习加速核的缩放算子计算方法，将输入张量的每个通道的二维特征向量展开成一维特征向量作为矩阵A的行，将输入张量的通道数C作为矩阵A的行数，将输入张量的每个通道的特征数H*W作为矩阵A的列数；根据输入张量的尺寸和输出张量的目标尺寸确定矩阵B的尺寸，将矩阵A的列数H*W作为矩阵B的行数，将输出张量的每个通道的特征数DST_H*DST_W作为矩阵B的列数，矩阵B的列对应输出张量的每个像素点，计算输出张量的每个像素点计算所需的权重，并将计算得到的权重放置于矩阵B的每一列对应位置；本发明提供的技术方案能够克服现有技术所存在的缩放算子计算效率较低的缺陷。

技术关键词

深度学习加速像素点矩阵计算方法滑动窗口处理单元阵列通道数据广播存储器神经网络处理器输出特征尺寸元素指令模式参数