一种基于轨迹的多智能体协作强化控制交通信号灯的方法
申请号:CN202510264993
申请日期:2025-03-07
公开号:CN120126331A
公开日期:2025-06-10
类型:发明专利
摘要
本发明提供一种基于轨迹的多智能体协作强化控制交通信号灯的方法。本发明首先根据历史轨迹和邻居节点的时空状态对未来轨迹进行预测。之后将轨迹的状态映射到嵌入空间,进而利用长短期记忆网络对信息进行聚合。嵌入空间中的距离被用作衡量轨迹相似度的指标。在相似轨迹对的基础上,本发明进一步提出了一种协作式强化学习算法。该算法通过将相似智能体之间的经验进行高效迁移,实现智能体间以知识协作为基础的协作学习,提升模型的训练效率和泛化能力。针对大规模分布式的交通信号控制场景,提出一种协作式强化学习的协同控制方法,有效的解决了集中式和分布式控制带来的问题,提升网络吞吐量和交通流量调度效率。
技术关键词
控制交通信号灯
轨迹
前馈神经网络
注意力机制
交通流量调度
节点
序列
多层感知机
协作式
协同控制方法
长短期记忆网络
强化学习算法
网络吞吐量
元素
分布式控制
神经网络模型
交通路口
邻居
服务器