有什么方法可以检测非正态分布数据中的异常值?

时间:2019-04-05 11:20:47

标签: python outliers

我正在研究时间序列分析的自动化。在此,我必须自动化在单变量时间序列中检测异常值的过程。因此我的数据可以是正态分布的,也可以是非正态分布的。

我知道grubb测试和箱形图可用于检测离群值,但应该用于正态分布数据

1 个答案:

答案 0 :(得分:0)

如果具有经验分布,则可以为此分布计算分位数(例如,在0.025和0.975处)。然后,超出分位数的值可以表示为离群值。注意,这仅对钟形分布(不像指数分布)有用。

在其他情况下,您应该注意每个分布的小数,例如在指数或泊松中,您应该只看向正确的部分。

有关更多答案,请https://stats.stackexchange.com/questions/129274/outlier-detection-on-skewed-distributions