是否有任何软件可以让我对2D数据集执行LOF异常值检测?我刚刚从原始论文中实现了LOF,并想检查我的结果是否正确。到目前为止,我找不到任何工具或在线服务。
答案 0 :(得分:1)
您是否查看了有关Local Outlier Factor的维基百科文章?它提到ELKI,它有一个LOF实现(有索引支持,所以O(n log n)
用于大型数据集。)
请注意,许多人忽略了LOF中的可达性距离,并且只是近似它。 ELKI的实现应该是正确的,因此它可以帮助您很好地测试结果。
答案 1 :(得分:1)
您应该检查rapidminer申请。并添加anomaly detection plugin。
答案 2 :(得分:0)
Rapid Miner将DARPA 1998数据集的IP地址属性视为多项式数据!但LOF并未针对此进行优化。有趣的是,RAPID MINER无法处理如此庞大的网络流量数据集。还有其他任何实现吗?