摘要
本发明涉及一种基于深度强化学习大模型的大规模路网交通管控方法,属于智能交通控制技术领域。该方法包括:感知包括城市道路交叉口、高速公路入口匝道与应急车道的实时多模态路网信息,通过融合空间图构建方法与时间序列嵌入方法,生成表征当前交通网络状态的时空融合表征向量;将时空融合表征向量与历史状态记忆拼接后作为输入,利用预训练大语言模型的骨干网络进行状态特征蒸馏以增强状态表征,并通过具有分层动作空间的策略网络输出交通管控决策;通过跨模态知识迁移与渐进式课程学习策略,对深度强化学习算法的训练过程进行引导和优化,以提升模型训练效率和泛化能力。本发明在保证实时响应速度的同时,使控制策略的泛化性能和准确性提高。