在可汗学院的概率统计课程中有一个关于创建盒须画的练习。这里的screenshot代表正确的解决方案。 但是当我试图在R中检查解决方案时,我得到了以下内容:
d <- c(11, 4, 1, 4, 2, 2, 6, 10, 5, 6, 0, 6, 3, 3)
summary(d)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.00 2.25 4.00 4.50 6.00 11.00
你可以看到第一曲的2.25值。但是正确的值是2.使用summary()返回的任何其他值都是正确的。任何想法为什么summary()返回错误的结果?
答案 0 :(得分:5)
简而言之,有许多合理的方法来计算分位数。这可以通过quantile
函数支持的九种(!)不同方法来证明。
summary
没有错,它只是使用与您期望的方法不同的方法。它可能使用默认方法7(在帮助页面中称为&#34;类型7和#34;)。与大多数其他方法一样,它在两个相邻值2和3之间执行线性插值。
您可以尝试使用相应的quantile
参数调用type
来尝试其他方法:
> quantile(s, type=1)
0% 25% 50% 75% 100%
0 2 4 6 11
答案 1 :(得分:3)
我也有同样的问题。我认为这与所使用的分位数计算的type
有关。
要查看示例:
quantile(d, probs=0.25)
25%
2.25
quantile(d, probs=0.25, type=6)
25%
2