基于多维层次语义蒸馏的深度学习模型压缩方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多维层次语义蒸馏的深度学习模型压缩方法
申请号:CN202510268117
申请日期:2025-03-07
公开号:CN120181167A
公开日期:2025-06-20
类型:发明专利
摘要
本发明涉及一种基于多维层次语义蒸馏的深度学习模型压缩方法,属于深度学习模型压缩领域。所述方法,首先从教师模型的深层次特征中提取潜在的高阶语义表征信息;然后,通过引入中间模型以桥接教师模型与学生模型之间的能力差距,逐步传递知识以缓解直接迁移引发的不匹配问题;最后设计一种更为细化的监督机制,不仅关注最终标准化后的类别预测,还强调类间级和类内级关系的知识信息捕获,以减小输出尺度差异带来的影响,同时增强模型对语义结构的感知能力。
技术关键词
教师 学生 蒸馏 皮尔逊相关系数 深度学习模型压缩 标签 语义结构 分类器 样本 定义 模型预训练 标准化方法 多层次 参数 批量 线性 度量
系统为您推荐了相关专利信息
关系抽取方法 实体 节点 预训练语言模型 注意力机制
工控设备 联邦学习方法 内环 蒸馏 联邦学习系统
检测损失 对象 特征提取模块 像素 视觉
神经网络方法 教师 学生 多旋翼无人机 无人机平台
大语言模型 资源受限环境 数据 训练语料库 分治策略