摘要
本发明公开了一种卷积权重梯度计算方法、装置、介质及设备,所述方法包括:获取第m个梯度部分和对应的第m个特征部分;将第m个特征部分的所有特征数据行加载到共享内存的SV个子区域,每个子区域内的特征数据行的行号构成公差为SV的等差数列;SV等于垂直步长;线程轮流访问不同的子区域并按需读取连续的内存块;每个线程对加载得到的梯度数据行和特征数据块进行滑动遍历和点乘运算,并将每个点乘结果累加至对应的权重梯度位置;当输出梯度图中所有梯度部分的梯度数据行和对应的特征数据块遍历计算完成后,获得卷积核的权重梯度矩阵。本发明能够将跨步访问转换为连续访问,显著地减少冗余数据的加载量,进而提升内存访问效率。