一种需要少量标注数据提升大模型诚实性的训练方法及系统
申请号:CN202510786331
申请日期:2025-06-12
公开号:CN120706550A
公开日期:2025-09-26
类型:发明专利
摘要
本发明公开了一种需要少量标注数据提升大模型诚实性的训练方法及系统,新增了一个轻量级网络,用于辅助LLM对数据进行自标注,从而在有限的标注数据基础上,显著扩大可用于模型训练的数据规模,使得模型能够在数据资源有限的情况下,依然能够得到充分的训练和优化。轻量级网络与LLM之间形成了紧密的协同工作机制,轻量级网络通过对LLM生成的回答进行诚实性评估,为未标注数据生成可靠的标注信息,这一过程不仅充分利用了LLM自身的概率评估能力,还结合了轻量级网络对诚实性的量化评估,使得模型能够在有限的数据条件下,学习到更加诚实的回答策略,实现了利用少量的数据增强LLM的诚实性的目的。
技术关键词
少量标注数据
网络
训练系统
标注策略
预训练模型
指标
数据格式
模块
令牌
规模
机制
线性
框架
资源
模式
基础