一种基于多智能体近端策略优化算法和高效动作解码的可重构车间动态调度方法及系统

申请号：CN202410767734

申请日期：2024-06-14

公开号：CN118780416A

公开日期：2024-10-15

类型：发明专利

摘要

本发明属于生产调度相关技术领域，并公开了一种基于多智能体近端策略优化算法和高效动作解码的可重构车间动态调度方法及系统。离线训练阶段：构建高层工件排序智能体、制造单元分配智能体和底层工件排序智能体，通过智能体与车间交互获得历史调度数据，基于历史调度数据和多智能体近端策略优化算法对各个智能体进行训练，将训练好的各个智能体用于在线应用；在线应用阶段：对于待加工的订单，利用离线阶段训练获得的三个智能体与车间进行多次交互，直至完成订单中所有任务的加工。相较于常用的基于生产经验的调度规则，本发明通过深度强化学习模型提供合理决策，同时能够快速响应多种扰动事件，保障了车间的高效生产和运行稳定性。

技术关键词

动态调度方法高效动作车间工件订单决策重构解码策略基准算法深度强化学习模型离线动态调度系统阶段代表执行器在线数据资源

系统为您推荐了相关专利信息

一种药品全流程智能工控管理方法和系统

控制服务器设备管理服务器消息管理服务器配药管理系统药品发放设备

基于非完整曲面拟合的三坐标测量方法

坐标测量方法完整点云数据多模态传感器区域生长算法投影面

生产决策自适应优化方法及系统

数字孪生仿真模型参数重构拓扑网络

电力办公软件人机交互界面调整方法、系统、终端及介质

人机交互界面布局订单编码标识

一种换热器管板上管子的扩径量自动检测系统及方法

自动检测系统直线电机自动检测方法激光测距仪换热器