摘要
本发明涉及一种基于强化学习的车路协同入口匝道合流控制方法,对于主线和匝道CAV通过路侧摄像头获取全局交通环境感知信息;路侧单元从交通环境感知信息中提取CAV状态并发布给各CAV;CAV通过所搭载的智能体基于CAV状态做出换道动作;控制区域内所有CAV共享同一套智能体网络参数,通过计算综合考虑了车辆安全、效率、动作执行效果以及对周围车辆速度影响的奖励函数对动作进行评估,并采用双重深度Q网络算法对其进行训练,同时优化CAV个体状态与合流区域整体效率。与现有技术相比,本发明可灵活应对CAV的车道、位置和数量变化等不同场景;综合考虑CAV周围车辆特征和路侧交通流信息,有效提升了合流效率。