一种多智能体强化学习可迁移的方法、装置以及设备

申请号：CN202411081505

申请日期：2024-08-08

公开号：CN118627587B

公开日期：2024-12-10

类型：发明专利

摘要

本发明公开了一种多智能体强化学习可迁移的方法、装置以及设备，其包括：对多智能体环境中实体的通用属性进行拆解，得到通用实体类以及对应的实体属性；基于所述通用实体类以及所述实体属性对实体进行特征定义和编码，得到实体特征序列；对所述实体特征序列进行特征的提取和融合，得到融合特征；基于所述融合特征进行实体的动作解耦，得到包括非指向性动作以及指向性动作的实体动作；利用强化学习算法将所述融合特征以及所述实体动作在不同的想定场景中进行泛化训练，得到多智能体模型；将所述多智能体模型部署至相应的目标想定场景中进行知识的迁移。能够更有效地迁移和应用已学习的知识，降低了对特定环境的依赖，提高了模型的泛化能力。

技术关键词

多智能体强化学习实体多智能体模型融合特征强化学习算法序列场景坦克无人机模拟系统动态连续型更新模型参数身份编码动作模块弹药注意力标识