摘要
本发明公开了一种面向对抗博弈的大语言模型多智能体协同决策方法,包括:构建对抗博弈环境协同决策大语言模型的微调训练数据集;基于LoRA方法微调对抗博弈环境协同决策大语言模型;构建记忆模块,存储智能体的历史博弈数据与其对博弈的理解;从对抗博弈环境中获取智能体的局部观察数据和共享全局状态信息,组合信息作为模型输入;将组合信息输入经微调的大语言模型,分析对抗博弈局势;根据上述的局势分析和记忆模块提供的信息,生成本回合的行动决策;根据行动决策生成可执行的动作;执行动作,更新记忆模块,进入下一回合。本发明方法可有效提高智能体在对抗博弈环境下进行协同决策的能力,为解决复杂系统中的协作与对抗博弈问题提供了创新的方法。