摘要
本申请涉及网络安全技术领域,尤其涉及一种网络防御方法、装置、设备及介质,用于有效应对不断变化的网络威胁,提高网络防御效果。该方法包括:构建深度强化学习DRL模型,设定DRL模型的状态空间和动作空间,并基于网络系统的关键防御指标,构建奖励函数;采用柔性动作‑评价SAC算法对DRL模型进行训练;获取网络系统的当前网络状态信息,并将当前网络状态信息输入至已训练完成的DRL模型中,得到最优网络防御措施,并执行最优网络防御措施。这样,利用深度强化学习技术,能够动态调整防护机制以应对不断变化的网络威胁,另外,检测到潜在威胁时,自动执行有效的网络防御措施,使得系统能够从被动监测转向主动防御。