基于多维层次语义蒸馏的深度学习模型压缩方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
基于多维层次语义蒸馏的深度学习模型压缩方法
申请号:
CN202510268117
申请日期:
2025-03-07
公开号:
CN120181167A
公开日期:
2025-06-20
类型:
发明专利
摘要
本发明涉及一种基于多维层次语义蒸馏的深度学习模型压缩方法,属于深度学习模型压缩领域。所述方法,首先从教师模型的深层次特征中提取潜在的高阶语义表征信息;然后,通过引入中间模型以桥接教师模型与学生模型之间的能力差距,逐步传递知识以缓解直接迁移引发的不匹配问题;最后设计一种更为细化的监督机制,不仅关注最终标准化后的类别预测,还强调类间级和类内级关系的知识信息捕获,以减小输出尺度差异带来的影响,同时增强模型对语义结构的感知能力。
技术关键词
教师
学生
蒸馏
皮尔逊相关系数
深度学习模型压缩
标签
语义结构
分类器
样本
定义
模型预训练
标准化方法
多层次
参数
批量
线性
度量
系统为您推荐了相关专利信息
1
一种文档级智能制造工艺流程关系抽取方法
关系抽取方法
实体
节点
预训练语言模型
注意力机制
2
一种基于动态分簇与双环协同训练的联邦学习方法及系统
工控设备
联邦学习方法
内环
蒸馏
联邦学习系统
3
一种基于双目视觉和开放词汇的3D目标检测方法及系统
检测损失
对象
特征提取模块
像素
视觉
4
多旋翼无人机航空计算平台的轻量化磁补偿神经网络方法
神经网络方法
教师
学生
多旋翼无人机
无人机平台
5
一种优化小型模型中代码思维链生成的方法
大语言模型
资源受限环境
数据
训练语料库
分治策略