摘要
一种基于SIP‑LOF的观测数据异常识别方法,包括以下步骤:先将待检测的观测数据通过PLR‑SIP方法提取出所有的数据点,再以起始与终点两个数据点作为分割点,计算两个分割点之间y向距离最大的点,然后依次计算相邻两个分割点之间y向距离最大的点,得到多个分割点,相邻两个分割点之间形成子序列;提取子序列的多种特征值,根据所有的特征值构建多维空间,然后将所有的特征值映射在多维空间中,计算每种特征值之间的距离;将距离值按大小排列之后找到每个样本的第k距离和前k个近邻,然后计算每个样本到k个近邻的可达距离、局部可达密度,然后进行局部离群因子LOF计算,得到LOF值。本发明能够在海量数据中快速自动定位异常数据。