一种基于自适应DBSCAN算法的SQL审核去重方法
申请号:CN202510971143
申请日期:2025-07-15
公开号:CN120929859A
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了应用系统测试技术领域的一种基于自适应DBSCAN算法的SQL审核去重方法,包括从数据库表获取原始SQL数据,对原始SQL数据进行数据清洗,得到第一SQL数据,对第一SQL数据去重,得到第二SQL数据;基于第二SQL数据中的每条SQL语句构建SQL语法树,获取结构特征向量,采用动态加权衰减的多层相似度计算方法计算SQL语句的结构特征相似度。本发明通过提出动态加权衰减相似度计算方法,能够根据字段和结构的特征自适应调整权重,提高聚类的准确性,即使在复杂环境下仍能有效进行SQL聚类,提升聚类结果的可靠性,从而降低此SQL审核场景下的审核性能负载及复杂度,通过利用相似度计算和聚类方法对重复的SQL有效去重,提高审核效率。
技术关键词
DBSCAN算法
去重方法
语句
邻域搜索方法
SQL语法
数据
度计算方法
列表
关键字
K近邻
参数
系统测试技术
动态
聚类算法
模块
层级
矩阵
复杂度