摘要
本发明提出了一种电动汽车与电网双向互动的动态规划模型(Bidirectional Dynamic Programming Interaction Model,BDPIM),旨在通过结合多时段动态规划与深度强化学习技术,实现电动汽车充放电策略与电网负荷调度的实时优化,兼顾用户成本最小化与电网收益最大化,提高智能电网运行效率和用户体验。该方法包括数据收集与预处理、模型构建、多时段动态规划求解、策略优化与反馈机制以及强化学习迭代优化。通过分阶段动态规划生成多时段充放电策略,结合深度Q网络(DQN)与Actor‑Critic架构实时调整决策,并融合电网负荷预测和用户行为模型,本发明能够实时输出双向互动的最优调度方案,并通过深度强化学习不断优化调度策略,形成闭环改进。与现有技术相比,本发明能够精准捕捉电网负荷波动与用户行为动态,提高系统的适应性与经济效益,具有显著的应用价值。