摘要
本发明公开了一种基于深度强化学习的连续退火炉智能温控方法,包括采集退火炉的历史运行数据,对采集到的数据进行预处理,将预处理后的数据组成状态变量;构建神经网络模拟器,将状态变量输入神经网络模拟器进行训练,预测退火炉下一时刻温度并输出;构建SAC模型,将状态变量输入SAC模型进行训练,生成奖励函数,并验证SAC模型的性能;利用PLC实时采集退火炉的数据并发送给边缘计算设备,通过边缘计算设备对采集到退火炉的数据进行实时归一化处理,将实时归一化处理后的退火炉的数据输入训练验证后的SAC模型,SAC模型实时输出控制指令并发送给PLC,利用PLC执行实时控制指令。本发明基于离线训练和在线部署的结合,降低人工调参需求,提高了控制效率。