模型训练方法、装置、电子设备及存储介质

申请号：CN202510916094

申请日期：2025-07-03

公开号：CN120409744B

公开日期：2025-09-26

类型：发明专利

摘要

本申请公开了一种模型训练方法、装置、电子设备及计算机存储介质。其中，该模型训练方法包括：基于预设训练样本集中的第一训练样本集对初始基线模型进行监督微调，得到监督微调模型以及偏好数据样本；基于偏好数据样本对初始奖励模型进行优化训练，得到目标奖励模型，以及基于偏好数据样本对监督微调模型进行优化训练，得到偏好优化模型；基于偏好优化模型和第一训练样本集生成第一奖励信号，以及基于偏好优化模型、目标奖励模型和预设训练样本集中的第二训练样本集生成第二奖励信号；基于第一奖励信号、第二奖励信号以及第二训练样本集对偏好优化模型进行优化训练，得到目标对象生成式预训练模型。采用该方法能够提升模型的泛化能力。

技术关键词

预训练模型训练样本数据训练样本集对象模型训练方法信号计算机存储介质基线模型训练装置无监督度量电子设备指标模块交互方法电商参数处理器

系统为您推荐了相关专利信息

意图识别方法和装置

训练样本数据令牌生成提示信息意图识别方法场景

图像采集方法、装置、电子设备及存储介质

字符识别图像采集方法对象坐标二值化图像

机器人视觉目标定位方法及装置

旋转变换矩阵图像分割模型坐标机器人视觉特征点

一种重量测量方法以及装置

床脚压力对象测量方法床面

缺血再灌注损伤级别分析方法及装置

缺血再灌注损伤心肌组织损伤视觉特征图像混合结构模型