摘要
本发明提供了一种基于图卷积网络的多目标协同追捕方法及系统,确定追铺环境;各追铺者通过节点编码作为顶点,顶点包含特征信息,利用图卷积网络中将所有顶点信息进行聚合,在聚合过程中,使用权重矩阵对顶点信息进行线性变换;利用边表述各追捕者之间的交互关系,各边和相应的权重矩阵相乘后进行整合,将整合后的信息和顶点信息进行拼接,根据拼接后的信息确定最优策略;利用演员‑评论家算法中的策略网络得到动作对逃逸者进行追捕,追铺环境给与相应的奖励回报输入价值网络,执行最优策略,实现多目标协同追捕。本发明升多目标追捕任务的追捕效率与成功率。