Python箱形图具有不同的须状长度

时间:2015-07-20 20:26:07

标签: python pandas matplotlib

我在Pandas中使用DataFrame.boxplot()函数,我认为它调用了matplotlib.pyplot.boxplot()。文件说这些箱形图的默认晶须长度应为1.5IQR,但我不明白为什么同一个盒子的上/下胡须在图中的长度不同。 (我没有做任何具体的配置)

抱歉,我想发布图片,但我没有足够的声誉,所以我把它放在免费的图片托管网站上,链接:

http://postimg.org/image/z0xtfg9gd/

3 个答案:

答案 0 :(得分:3)

您是否在问为什么顶部胡须与底部的长度不同?我认为晶须实际上是1.5 IQR内的最低或最高数据点。因此,如果Q3和Q3 + 1.5 IQR之间没有数据点,则顶部晶须不会出现。对于一个箱形图,其顶部和底部的胡须都超出了胡须,胡须看起来大小相同。

答案 1 :(得分:2)

听起来像是对箱形图的一般误解。

从一个箱图到任何其他箱图,胡须长度有两个原因

  1. 每个数据集的IQR不同
  2. 胡须仅延伸Q1内的最外点 - 1.5 * IQR和Q3 + 1.5 * IQR范围。因此,如果Q3 + 1.5 * IQR = 75,但样品的最大值为70,则须在70处绘制晶须。

答案 2 :(得分:0)

胡须的长度不同,因为每个数据集的IQR可能不同

Interquartile range占据所有数据的50%,因此当数据更广泛时更广泛。此外,如果所有数据点都在Q1 - 1.5 * IQR和Q3 + 1.5 * IQR之内,那么晶须只会被绘制到这些点,这也会使它们变小。