基于多维层次语义蒸馏的深度学习模型压缩方法

申请号：CN202510268117

申请日期：2025-03-07

公开号：CN120181167A

公开日期：2025-06-20

类型：发明专利

摘要

本发明涉及一种基于多维层次语义蒸馏的深度学习模型压缩方法，属于深度学习模型压缩领域。所述方法，首先从教师模型的深层次特征中提取潜在的高阶语义表征信息；然后，通过引入中间模型以桥接教师模型与学生模型之间的能力差距，逐步传递知识以缓解直接迁移引发的不匹配问题；最后设计一种更为细化的监督机制，不仅关注最终标准化后的类别预测，还强调类间级和类内级关系的知识信息捕获，以减小输出尺度差异带来的影响，同时增强模型对语义结构的感知能力。

技术关键词

教师学生蒸馏皮尔逊相关系数深度学习模型压缩标签语义结构分类器样本定义模型预训练标准化方法多层次参数批量线性度量

系统为您推荐了相关专利信息

一种文档级智能制造工艺流程关系抽取方法

关系抽取方法实体节点预训练语言模型注意力机制

一种基于动态分簇与双环协同训练的联邦学习方法及系统

工控设备联邦学习方法内环蒸馏联邦学习系统

一种基于双目视觉和开放词汇的3D目标检测方法及系统

检测损失对象特征提取模块像素视觉

多旋翼无人机航空计算平台的轻量化磁补偿神经网络方法

神经网络方法教师学生多旋翼无人机无人机平台

一种优化小型模型中代码思维链生成的方法

大语言模型资源受限环境数据训练语料库分治策略