摘要
本申请适用于深度强化学习技术领域,提供了一种用于建筑能源控制的深度强化学习方法及系统,该方法包括:基于目标建筑环境构建智能体;收集智能体与目标建筑环境进行交互时的普通经验数据;构建提示文本;将提示文本输入大语言模型,得到控制动作的动作范围;根据动作范围对普通经验数据进行修正处理,得到基于LLM修正的经验数据;根据普通经验池和LLM经验池,通过最小化损失函数对智能体进行训练。本申请利用大语言模型分析不同环境状态下的控制动作的动作范围,从而对智能体随机探索中低质量的经验数据进行指导修正,使智能体能够获得高质量经验,提高建筑能源控制策略学习的效率和整体性能。