大模型训练方法及相关设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大模型训练方法及相关设备
申请号:CN202510611990
申请日期:2025-05-13
公开号:CN120725089A
公开日期:2025-09-30
类型:发明专利
摘要
本申请提供一种大模型训练方法,其特征在于,包括:收集第一数据集,并利用所述第一数据集对第一模型进行微调训练,得到第二模型;收集第二数据集,基于所述第二模型,对所述第二数据集进行优化处理,得到第三数据集;利用所述第三数据集对所述第二模型进行训练,得到最终训练好的大模型。本申请实施例通过使用自引导策略,生成大量的链式思维数据,解决了链式思维数据缺乏的问题,提升了大模型的推理能力。
技术关键词
问答对数据 模型训练方法 计算机程序指令 模型训练装置 计算机程序产品 处理器 存储器 电子设备 模块 策略 关系