R的summary()函数计算背后的理性

时间:2015-09-13 04:19:37

标签: r summary

在计算平均值时,R summary()函数是否排除NA值。虽然我试图从帮助文档中查找信息,但我找不到答案。

2 个答案:

答案 0 :(得分:2)

是的,确实如此,看看这个例子:

x1 <- c(1, 4, 3, NA, 7)
summary(x1)

输出:

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
   1.00    2.50    3.50    3.75    4.75    7.00       1 

现在看:

mean(x1)
> [1] NA

mean(x1, na.rm=T)
[1] 3.75

所以,总结确实使用na.rm = T作为统计数据,最后的结果是NA的计数(在我的例子中NA&#39; s = 1)。

该示例来自:http://www.ats.ucla.edu/stat/r/faq/missing.htm

答案 1 :(得分:1)

ddsu的回答表明它确实如此,但这里是如何做到的。检查else if (is.numeric(object)) { nas <- is.na(object) object <- object[!nas] qq <- stats::quantile(object) qq <- signif(c(qq[1L:3L], mean(object), qq[4L:5L]), digits) names(qq) <- c("Min.", "1st Qu.", "Median", "Mean", "3rd Qu.", "Max.") if (any(nas)) c(qq, `NA's` = sum(nas)) else qq } 源代码。从第14行开始:

ALTER TABLE `AA` ADD `ba` INT NOT NULL AFTER `b`

因此,在计算这些数值之前,会过滤掉这些数据,然后在有任何数据的情况下将其计数加入。