基于异常检测的数据样本标签噪声检测方法、装置及设备
申请号:CN202510790005
申请日期:2025-06-13
公开号:CN120910402A
公开日期:2025-11-07
类型:发明专利
摘要
本申请提供一种基于异常检测的数据样本标签噪声检测方法、装置及设备。能够对初始样本数据集利用模型进行K折交叉验证过程,并利用蒙特卡罗丢弃算法得到每个样本数据属于恶意样本的预测概率,根据预测概率确定对应的特征指标,将特征指标按照验证时间进行排序,得到每个样本数据对应的时序特征,并对时序特征进行预处理得到预处理后的数据特征;通过对预处理后的数据特征进行基于密度的聚类处理,和/或孤立森林处理,能够识别出异常标签的数据特征;该异常标签的数据特征对应的样本数据属于噪声标签,需要将其进行标签翻转,避免噪声标签的样本数据的干扰,使得最终得到的剩余的样本数据的样本数据集更加准确,保证了样本数据集的质量的可靠性。
技术关键词
时序特征
数据
噪声标签
噪声检测方法
蒙特卡罗
恶意样本
特征值
协方差矩阵
噪声检测装置
指标
算法
密度
异常点
数值
计算机
处理器
邻域