摘要
本发明公开了一种基于大语言模型偏好对齐的问答生成方法及系统,涉及人工智能自然语言处理技术领域,包括以下步骤:将每个原问题与指定提示进行拼接,将拼接指令输入至释义生成器,生成与该原问题对应的多个释义;将每个原问题以及对应的多个释义输入至目标大语言模型,将多个释义分为受偏释义集与非受偏释义集;将非受偏释义集作为输入,受偏释义集作为输出对预训练语言模型进行训练,得到具偏释义生成器。本发明实现问题偏好对齐所需的整个流程是一个黑箱优化过程,不需要获取与更改目标大语言模型的任何参数,可以解决传统白盒方法计算资源需求高,存在隐私泄露和安全隐患的问题。