为什么summary()给max()一个不同的最大值

时间:2013-01-26 12:11:14

标签: r

在Windows XP上使用R-2.15.2我从summary()获得的最大值与max()不同。 为什么会这样?

以下是相关代码:

> class(dat)
[1] "data.frame"
> dim(dat)
[1] 3850   54
> summary(dat$enrol)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    26     945    1744    3044    3128  183200 
> max(dat$enrol)
[1] 183151

为什么summary()将结果四舍五入的任何想法?

最佳

奥利弗

1 个答案:

答案 0 :(得分:15)

这是关于digits参数打印结果的方式。默认值为

> max(3, getOption("digits")-3)
[1] 4

为什么R向上舍入只是使用中的默认规则 - 转到最近的偶数位。我们可以通过signif()

看到这一点
> signif(183151, digits = 4)
[1] 183200

,正如?summary告诉我们的那样,是summary()使用的内容,由digits参数控制:

digits: integer, used for number formatting with ‘signif()’ (for
        ‘summary.default’) or ‘format()’ (for ‘summary.data.frame’).

阅读?signif了解有关舍入问题的更多信息。

要获得更多有效数字,请通过summary()参数将更高的数字传递给digits

例如

> set.seed(1)
> vec <- c(10, 100, 1e4, 1e5, 1e6) + runif(5)
> summary(vec)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
     10.3     100.4   10000.0  222000.0  100000.0 1000000.0 
> summary(vec, digits = 7)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
     10.3     100.4   10000.6  222022.5  100000.9 1000000.0 
> summary(vec, digits = 8)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
     10.3     100.4   10000.6  222022.5  100000.9 1000000.2