基于异常检测的数据样本标签噪声检测方法、装置及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于异常检测的数据样本标签噪声检测方法、装置及设备
申请号:CN202510790005
申请日期:2025-06-13
公开号:CN120910402A
公开日期:2025-11-07
类型:发明专利
摘要
本申请提供一种基于异常检测的数据样本标签噪声检测方法、装置及设备。能够对初始样本数据集利用模型进行K折交叉验证过程,并利用蒙特卡罗丢弃算法得到每个样本数据属于恶意样本的预测概率,根据预测概率确定对应的特征指标,将特征指标按照验证时间进行排序,得到每个样本数据对应的时序特征,并对时序特征进行预处理得到预处理后的数据特征;通过对预处理后的数据特征进行基于密度的聚类处理,和/或孤立森林处理,能够识别出异常标签的数据特征;该异常标签的数据特征对应的样本数据属于噪声标签,需要将其进行标签翻转,避免噪声标签的样本数据的干扰,使得最终得到的剩余的样本数据的样本数据集更加准确,保证了样本数据集的质量的可靠性。
技术关键词
时序特征 数据 噪声标签 噪声检测方法 蒙特卡罗 恶意样本 特征值 协方差矩阵 噪声检测装置 指标 算法 密度 异常点 数值 计算机 处理器 邻域
系统为您推荐了相关专利信息
蒙特卡洛树搜索方法 时序特征 概率分布函数 控制策略 图谱
读写方法 Flash控制器 模块 数据存储 通道
拟合优度检验 计算方法 模型库 降水预测技术 广义帕累托分布
质谱仪 数据分析终端 模型支架 监测系统 采样器
队列调度装置 标识 状态机 闪存芯片 队列调度方法