基于解耦知识蒸馏的模型训练方法、装置、设备及介质

申请号：CN202411922274

申请日期：2024-12-25

公开号：CN119990254A

公开日期：2025-05-13

类型：发明专利

摘要

本申请提供了一种基于解耦知识蒸馏的模型训练方法、装置、设备及介质。本申请获取用于识别图像中目标对象的类别的教师模型和学生模型，将第一样本图像输入教师模型和学生模型，得到教师模型输出的第一特征和学生模型输出的第二特征；通过扩散模型去除第二特征中的噪声数据得到第三特征，扩散模型是基于噪声预测网络，根据第二样本图像以最小化学生模型输出的特征与教师模型输出的特征间的差异为目标训练得到的；根据第一特征和第三特征间的KL散度损失，通过反向传播算法对学生模型进行训练直至满足预设停止条件。本申请可实现教师模型输出的特征和学生模型输出的特征间的精确对齐，缩小教师模型和学生模型间的特征表征差距，提升模型训练效果。

技术关键词

模型训练方法皮尔逊相关系数学生教师噪声预测噪声数据传播算法非暂态计算机可读存储介质图像样本蒸馏对象模型训练装置重构处理器输入模块网络存储器电子设备

系统为您推荐了相关专利信息

一种基于校准教师模型的知识蒸馏的电熔镁炉异常检测方法

电熔镁炉异常检测方法校准教师标签

召回模型训练、对象召回、内容推荐方法及内容推荐系统

样本对象内容推荐请求内容推荐系统模型训练方法

一种基于VR眼镜的教学模拟系统

教学模拟系统 VR眼镜学习终端数据采集模块子模块

一种电池极片表面颗粒物检测方法

颗粒物检测方法电池极片表面孪生神经网络网络模块教师

教育教学用智能协作学习平台及实时互动引导方法

智能协作个性化学习路径平台模块数据采集模块消息系统