摘要
本发明涉及领域,具体公开了一种兼顾参与调频的工商业储能电站峰谷套利的强化学习策略,涉及储能系统优化运行领域,针对工商业储能电站实际运行过程中多项参数提前未知,难以作出有利于实现长期盈利的充放电计划问题,公开一种兼顾调频的工商业储能电站峰谷套利强化学习策略。该策略明确收益结算机制,量化峰谷套利充电支出、峰谷套利放电收益、日需量差额支出、一次调频补偿和调频购电支出;构建以储能电站峰谷套利日收益最优为目标,功率限制、防逆流、荷电状态循环等为约束的调度优化模型;设计优化策略并定义状态空间、动作空间和奖励函数;根据长短期记忆模型预测的用户净负荷,采用近端策略优化强化学习算法求解储能充放电功率;加载训练完成的模型以执行策略。该策略不仅能拓宽工商业储能电站的收入来源,还能实现工商业储能电站的高效利用与商业收益提质增效。