R:summary()返回奇怪的第1曲

时间:2014-11-30 06:38:27

标签: r summary

在可汗学院的概率统计课程中有一个关于创建盒须画的练习。这里的screenshot代表正确的解决方案。 但是当我试图在R中检查解决方案时,我得到了以下内容:

d <- c(11, 4, 1, 4, 2, 2, 6, 10, 5, 6, 0, 6, 3, 3)
summary(d)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   0.00    2.25    4.00    4.50    6.00   11.00 

你可以看到第一曲的2.25值。但是正确的值是2.使用summary()返回的任何其他值都是正确的。任何想法为什么summary()返回错误的结果?

2 个答案:

答案 0 :(得分:5)

简而言之,有许多合理的方法来计算分位数。这可以通过quantile函数支持的九种(!)不同方法来证明。

summary没有错,它只是使用与您期望的方法不同的方法。它可能使用默认方法7(在帮助页面中称为&#34;类型7和#34;)。与大多数其他方法一样,它在两个相邻值2和3之间执行线性插值。

您可以尝试使用相应的quantile参数调用type来尝试其他方法:

> quantile(s, type=1)
  0%  25%  50%  75% 100% 
   0    2    4    6   11 

答案 1 :(得分:3)

我也有同样的问题。我认为这与所使用的分位数计算的type有关。

本文最好地解释了它:http://datapigtechnologies.com/blog/index.php/why-excel-has-multiple-quartile-functions-and-how-to-replicate-the-quartiles-from-r-and-other-statistical-packages/

要查看示例:

quantile(d, probs=0.25)
25% 
2.25 
quantile(d, probs=0.25, type=6)
25% 
2