摘要
本申请公开了一种基于Bert模型的混合剪枝方法、设备及存储介质,涉及神经网络技术领域,所述基于Bert模型的混合剪枝包括:获取当前次迭代的剪枝量,所述剪枝量根据预设的目标剪枝参数,通过余数补偿策略计算得到;加载第n‑1次迭代生成的掩码矩阵,识别并移除所有标记为零值参数的参数位置,生成仅含非零参数的中间矩阵;将所述中间矩阵的所述非零参数按行优先顺序重新排列为连续存储的稠密矩阵;调整所述稠密矩阵的维度,使所述稠密矩阵行数保持不变,列数缩减至目标维度,以重塑为规则化矩阵,输出剪枝后的所述Bert模型。本申请达成了在保证模型精度的基础上,提高Bert模型的吞吐量的技术效果。