摘要
一种基于拥塞感知和缓存通信的多智能体路径规划方法,多智能体局部环境信息的采集和处理;根据动态环境构建拥塞信息;构建深度神经网络提取可观测环境特征;通过缓存通信机制使局部范围内的智能体进行有效信息交互,推动多智能体协作任务完成;基于D3QN方式对网络模型进行训练,并引入优先经验回放和课程学习,提高方法学习效率和稳定性。本发明在深度强化学习方法的基础上,抽象出拥塞信息使得智能体具备拥塞感知能力,有效缓解运行过程中拥塞情况的发生,同时引入缓存通信机制,规避大规模任务中选择通信对象的难题,使得随着任务规模的扩大仍保持着良好的求解效果,且分布式的部署方式便于扩展至更大的任务场景,有较好的实用价值。