摘要
本发明提供了一种基于多智能体强化学习的协同决策系统,包括全局决策协调模块、智能体局部决策模块、状态信息共享模块、冲突检测与解决模块和安全与隐私保护模块,本发明采用分布式多智能体结构,使每个智能体在局部环境中实现自主决策和实时学习,减少系统对集中控制的依赖,通过分布式有效降低系统在数据交互时的通信负担,使智能体能够基于本地数据直接进行响应,通过全局决策协调模块实时收集和分析各智能体的状态信息,并基于强化学习算法调整系统的整体策略,以保证在复杂环境中的全局目标实现,通过全局优化有效避免传统系统在动态环境中无法自适应调整的局限性,确保多智能体协同系统在各智能体目标基础上的全局最优。