从非正态分布向量确定离群值

时间:2018-08-20 12:15:02

标签: python list outliers

我希望能够从数据不符合正态分布的列表中确定异常值。

list = [0, 1, 2, 3, 2, 1, ..., 2, 50, 100, 101, 102, 103, 101, ... 100, 150]

outlier = [50, 150] 

有什么想法吗?

1 个答案:

答案 0 :(得分:0)

一个想法是使概率密度函数(pdf)适合您的数据(请参见this link)。然后,您可以查看给定估计函数提供某些值的可能性。任何与pdf差异太大的数据点都可能被认为是离群值。


编辑同样,根据您的数据,您似乎可以将数据以两个正态分布拟合,分别为explained in this articleµ1 = 2µ2 = 102和{{1 }}。不过,我建议凭经验估算这些值(或鉴于您知道每个高斯,只需从那里取值即可)。最后,您可以检查您的pdf是否确实是multimodal iff d > 1


这对您有帮助吗?如果没有,请告诉我们原因!

欢呼