摘要
本发明公开了一种数据安全合规评估与识别方法及系统,涉及数据安全合规评估与识别技术领域,包括通过API接口采集法规文本数据,采用自然语言处理库NLTK对法规文本数据进行预处理,得到格式化的法规文本数据;采用预计算的词嵌入方法,将格式化的法规文本数据中的每个词映射为固定长度向量,并生成数字向量;采用命名实体识别NER方法标记出数字向量中的重要术语,得到关键概念文本;基于机器学习算法建立评估模型,将数字向量输入评估模型中,采用加权平均法计算输出评估值,设定评估阈值与评估值进行比对,判断数字向量是否合规,并得到评估结果;基于异常检测算法构建识别模型,将关键概念文本输入识别模型中。