摘要
本发明提出了一种面向智算网络的安全防护方法,步骤为:将网络流量数据集进行预处理,划分为训练集和测试集;进行特征选择,在特征空间中探索搜索最优的特征子集;将网络入侵检测过程建模为马尔科夫决策过程,将特征子集映射到神经网络中的状态、动作并设计奖励函数;与SAC强化学习算法结合并搭建经验回放池,构建用于网络入侵检测的强化学习智能体;定义对抗性的攻击方智能体和防御方智能体,使用异步更新方式进行参数同步;分别创建攻防双方的子智能体进行迭代对抗;利用测试集评估防御方智能体的分类能力。本发明进行特征选择,减少计算量,提高检测效率;引入对抗性训练机制确保面对复杂网络攻击能迅速准确检测与响应。