如何在matplotlib的箱线图中自定义(重新定义)离群值(离群值)?

时间:2020-03-11 14:49:54

标签: python matplotlib statistics boxplot

我有一些数据点,在使用pl.boxplot()进行绘制之前,我自己删除了它们的异常值。现在,使用此功能绘制它们之后,我可以在图中看到一些传单。我不想删除传单,而是将其放入包装盒中。我该如何解决?

Boxplots

1 个答案:

答案 0 :(得分:1)

如果只想省略显示异常值,则可以使用showfliers的{​​{1}}参数。

但是,如果我正确地解释了您的问题,您希望仍然显示传单,但将其包含在箱线图的晶须中吗?如果是这样,那么根据箱线图的标准解释是不可能的。

通常,框的下限定义为第25个百分点(Q1)。同样,框的上限定义为第75个百分点(Q3)。这些位置之间的差异定义为四分位间距(IQR)。

然后,将箱线图的上下胡须定义为Q3 + 1.5 * IQR和Q1-1.5 * IQR。晶须之外的任何点都被分类为离群值。因此,异常值将总是在标准箱线图中箱外。

如果希望将“异常值”包含在框中,则必须打破框线图的图形约定。您可以通过更改定义框的上部和下部的百分位数来做到这一点。如果是您要实现的,那就有一个outline of how to do so here。 (通常,我不建议您破坏图形约定,这很容易误导读者)