一种多智能体强化学习可迁移的方法、装置以及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多智能体强化学习可迁移的方法、装置以及设备
申请号:CN202411081505
申请日期:2024-08-08
公开号:CN118627587B
公开日期:2024-12-10
类型:发明专利
摘要
本发明公开了一种多智能体强化学习可迁移的方法、装置以及设备,其包括:对多智能体环境中实体的通用属性进行拆解,得到通用实体类以及对应的实体属性;基于所述通用实体类以及所述实体属性对实体进行特征定义和编码,得到实体特征序列;对所述实体特征序列进行特征的提取和融合,得到融合特征;基于所述融合特征进行实体的动作解耦,得到包括非指向性动作以及指向性动作的实体动作;利用强化学习算法将所述融合特征以及所述实体动作在不同的想定场景中进行泛化训练,得到多智能体模型;将所述多智能体模型部署至相应的目标想定场景中进行知识的迁移。能够更有效地迁移和应用已学习的知识,降低了对特定环境的依赖,提高了模型的泛化能力。
技术关键词
多智能体强化学习 实体 多智能体模型 融合特征 强化学习算法 序列 场景 坦克 无人机 模拟系统 动态 连续型 更新模型参数 身份 编码 动作模块 弹药 注意力 标识