摘要
本发明属于计算机技术领域,特别涉及软件源代码漏洞修复,具体是一种基于双向预训练的软件漏洞自动修复方法,包括下步骤:爬取漏洞及其对应补丁作为数据集;使用数据清洗与BPE分词对数据集中的数据进行预处理;使用Word Embedding对预处理后的数据进行向量化转换;将向量化后的数据输入到构建好的漏洞修复模型并对漏洞代码进行修复。本发明可提升修复准确性、优化修复效率、增强适用性和通用性;模型在生成漏洞修复时能够更加准确地理解和处理标记之间的关系,有效提高模型处理新标记的能力;可有效应对快速变化的威胁环境,提高软件系统整体抗攻击能力,缩短漏洞暴露期,减少潜在风险,促使软件开发过程更加迅速和可靠。