摘要
本发明公开了一种基于语义嵌入向量生成模型的代码嵌入方法,属于计算机技术领域,包括以下步骤:获取二进制代码块并进行反汇编处理和基于不同粒度的代码结构分析,以得到二进制代码块对应的基本块以及控制流图结构特征;基于二进制代码块对应的基本块以及控制流图结构特征进行汇编指令线性转化和跨指令集语义嵌入转化,以生成跨指令集架构对应的统一二进制代码语义嵌入向量空间;获取已知漏洞样本并进行语义漏洞表征分析和候选漏洞检索定位,以生成候选漏洞代码块集合;对候选漏洞代码块集合进行动态分析验证并识别出对应的漏洞修复状态,以输出对应的二进制漏洞代码块检测报告。本发明能够实现二进制代码的高精度语义嵌入。