数据蒸馏方法和装置、电子设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
数据蒸馏方法和装置、电子设备及存储介质
申请号:CN202510729636
申请日期:2025-05-30
公开号:CN120670842A
公开日期:2025-09-19
类型:发明专利
摘要
本申请实施例提供了一种数据蒸馏方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:基于原始视觉语言数据集对原始基准模型进行训练得到目标基准模型;基于候选数据集对原始学生模型进型训练得到目标学生模型;对目标基准模型和目标学生模型进行对比学习得到模型学习差异数据;基于模型学习差异数据对候选数据集的图像样本进行像素调整得到目标图像;基于模型学习差异数据对候选数据集的文本样本进行文本表示调整得到目标文本;基于目标图像和目标文本构建目标视觉语言数据集。本申请可应用于金融科技、医疗科技等需要大量视觉语言数据的业务系统中,通过数据蒸馏技术对大量视觉语言数据进行蒸馏,能够提高数据蒸馏的准确性。
技术关键词
文本 数据 学生 样本 基准 嵌入特征 视觉 参数 蒸馏方法 模型训练模块 矩阵 电子设备 可读存储介质 人工智能技术 蒸馏装置 图像像素 业务系统