我在Pandas中使用DataFrame.boxplot()函数,我认为它调用了matplotlib.pyplot.boxplot()。文件说这些箱形图的默认晶须长度应为1.5IQR,但我不明白为什么同一个盒子的上/下胡须在图中的长度不同。 (我没有做任何具体的配置)
抱歉,我想发布图片,但我没有足够的声誉,所以我把它放在免费的图片托管网站上,链接:
答案 0 :(得分:3)
您是否在问为什么顶部胡须与底部的长度不同?我认为晶须实际上是1.5 IQR内的最低或最高数据点。因此,如果Q3和Q3 + 1.5 IQR之间没有数据点,则顶部晶须不会出现。对于一个箱形图,其顶部和底部的胡须都超出了胡须,胡须看起来大小相同。
答案 1 :(得分:2)
听起来像是对箱形图的一般误解。
从一个箱图到任何其他箱图,胡须长度有两个原因
答案 2 :(得分:0)
胡须的长度不同,因为每个数据集的IQR可能不同!
Interquartile range占据所有数据的50%,因此当数据更广泛时更广泛。此外,如果所有数据点都在Q1 - 1.5 * IQR和Q3 + 1.5 * IQR之内,那么晶须只会被绘制到这些点,这也会使它们变小。