摘要
本发明提供了一种基于迁移学习和损失调整的多模态长文本漏洞分类方法,属于计算机技术领域,解决了现有方法分类准确率低、泛化能力差的技术问题。包括以下步骤:S1:预处理数据集;S2:划分训练集、验证集和测试集;S3:将漏洞描述和代码信息的双模态信息拼接为长文本输入,并设计滑动窗口分段融合方法;S4:微调预训练语言模型完成漏洞评估任务,并采用早停策略;S5:将评估任务中学习到的知识迁移至漏洞分类任务;S6:设计动态损失函数调整机制进行权重调整;S7:将测试集数据输入训练完成的模型,进行漏洞分类预测。本发明的有益效果为:通过迁移学习和损失调整提升了漏洞分类任务的性能。