有人可以指点一下Robust-PCA或基于角度的异常值检测(ABOD)等算法的强大python实现吗?我尝试了一些Robust-PCA的python实现,但结果却是内存非常密集,程序崩溃了。我的数据集是60,000 X 900浮点数。 R有一个ABOD的实现,但我想坚持使用python。
答案 0 :(得分:1)
异常值检测非常重要,有很多研究出版物处理它。 基于密度的算法的可扩展性并不是真正的高效。 我使用PCA来减少维度和局部异常因子方法。
您可以在以下位置找到适用于海量数据的良好实施版本: https://github.com/damjankuznar/pylof/blob/master/lof.py
HTH