摘要
本发明提供一种基于深度强化学习的临近空间飞行器能源系统管理方法,包括采集能源系统的实时数据;构建Actor‑Critic架构的模型;对模型进行训练;将实时数据输入至Actor网络中,得到对应的充放电策略,Actor网络将动作系数输出至各节点;将动作系数经过离散化后,输出各节点电池的开关动作;将开关动作转换为能源系统电池的开关量。本发明的有益效果是通过采用深度强化学习模型能够根据环境条件的变化调整其策略,达到最优化能源使用的效果;智能充放电策略可以减少电池的深度放电和频繁的充放电循环,从而延长电池的使用寿命;深度强化学习可以学习在各种条件下维持飞行器的稳定运行,减少因能源管理不当导致的意外停机或性能下降。