摘要
本发明属于电力系统优化调度技术领域,公开一种基于数理模型双驱动的港口智能调度方法,包括以下步骤:输入港口物流系统与能源系统实时的运行数据;基于深度强化学习模型,采用运行数据进行训练,建立状态‑动作‑奖励的映射关系,生成数据驱动的初步调度策略;基于运行数据,构建模型驱动的交通分配‑用户均衡优化模型,得到能使运营成本最小的能源定价策略;构建多智能体协同决策框架协调初步调度策略和交通分配‑用户均衡优化模型,实现双驱动策略协同的迭代优化;基于迭代优化结果,采用双重深度Q网络结构动态选择最优子启发式策略;解决了现有技术中存在着策略泛化能力不足以及动态环境适应性差的问题。