摘要
一种基于语义检索增强Q学习的网络安全剧本编排方法,步骤包括:(一)通过预训练的语言模型将威胁情报嵌入高维向量空间,从安全剧本知识库中选取最相关的防御策略原子;(二)结合原子的打分和安全编排图模型的评分,构建安全编排图,并量化策略的成本与效果;(三)在Q学习框架下进行动态剧本决策。步骤(一)中,用预训练语言模型嵌入威胁情报和原子文本描述;然后计算二者的语义相似性;最后从知识库中选出最相关的原子;步骤(二)中,采用候选原子作为图模型的节点,根据原子的多维指标及原子之间的关系建立图模型;步骤(三)中,根据当前网络态势和图得分构建状态‑动作‑奖励模型;对原子顺序编排迭代优化,实现剧本决策的动态调整。