OpenAI 12连发第2弹:强化微调,少量样本就能训练自己的专家模型
OpenAI 12连发第2弹:强化微调,少量样本就能训练自己的专家模型强化微调可以轻松创建具备强大推理能力的专家模型。
来自主题: AI技术研报
8615 点击 2024-12-07 11:46
强化微调可以轻松创建具备强大推理能力的专家模型。
OpenAI“双12”直播第二天,依旧简短精悍,主题:新功能强化微调(Reinforcement Fine-Tuning),使用极少训练数据即在特定领域轻松地创建专家模型。少到什么程度呢?最低几十个例子就可以。