一种基于深度学习加速核的缩放算子计算方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于深度学习加速核的缩放算子计算方法
申请号:CN202510448639
申请日期:2025-04-10
公开号:CN120297345A
公开日期:2025-07-11
类型:发明专利
摘要
本发明涉及神经网络处理器NPU,具体涉及一种基于深度学习加速核的缩放算子计算方法,将输入张量的每个通道的二维特征向量展开成一维特征向量作为矩阵A的行,将输入张量的通道数C作为矩阵A的行数,将输入张量的每个通道的特征数H*W作为矩阵A的列数;根据输入张量的尺寸和输出张量的目标尺寸确定矩阵B的尺寸,将矩阵A的列数H*W作为矩阵B的行数,将输出张量的每个通道的特征数DST_H*DST_W作为矩阵B的列数,矩阵B的列对应输出张量的每个像素点,计算输出张量的每个像素点计算所需的权重,并将计算得到的权重放置于矩阵B的每一列对应位置;本发明提供的技术方案能够克服现有技术所存在的缩放算子计算效率较低的缺陷。
技术关键词
深度学习加速 像素点 矩阵 计算方法 滑动窗口 处理单元 阵列 通道 数据广播 存储器 神经网络处理器 输出特征 尺寸 元素 指令 模式 参数