我已经研究了局部离群因素,但我想知道我们如何在实际示例中使用它?我是说它是单独用于分类还是与其他分类算法一起使用? 它是数据预处理的一部分吗?为了进一步解释我的问题,假设我有一个数据集并且我想对其进行分类,但是有离群值,那么我是否应该应用局部离群值因子,它将消除离群值,因此可以对它应用分类算法?或按局部离群因素
进行分类答案 0 :(得分:0)
局部异常值是一种常用的异常检测工具。 采用局部方法更好地检测有关其邻居的异常值,而全局策略可能并不是密度波动的数据集的最佳检测方法。
尽管LOF值等于或小于1可以很好地表明一个离群值,但我们在这里进行计算并可能去除离群值或异常。 您是否有紧密,干净且统一的数据集?那么LOF值为1.05可能是一个离群值。 您是否具有稀疏的数据集,其密度不同,并且具有针对该局部簇的许多局部波动?那么LOF值2可能仍然是一个整数。