针对多车强化学习的决策方法、装置、存储介质及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
针对多车强化学习的决策方法、装置、存储介质及设备
申请号:CN202411867666
申请日期:2024-12-18
公开号:CN119807896A
公开日期:2025-04-11
类型:发明专利
摘要
本申请公开一种针对多车强化学习的决策方法、装置、存储介质及设备,包括:为基于多车强化学习模型控制的每个车辆分配优先级指数;按照优先级指数从高到低的顺序遍历每个车辆;针对遍历的当前车辆,获取多车强化学习模型输出的第i时间步内的探索性动作,判断当前车辆与其他车辆在第i时间步内是否存在碰撞风险;若不存在,则将第i时间步内的探索性动作作为当前车辆在第i时间步内的实际动作;否则基于当前车辆在第i时间步处的安全裕度,从有效动作集合中筛选出当前车辆在第i时间步内的实际动作;将i+1后获得新的i,并返回执行获取第i时间步内探索性动作的步骤,直至确定当前车辆在预设时间范围内每个时间步的实际动作后,继续遍历下一车辆。
技术关键词
强化学习模型 车道 车辆运动学模型 轨迹 指数 车头 决策方法 终点 风险 分配单元 存储装置 电子设备 策略 处理器 网络 模块 可读存储介质 程序