如何在生成摘要统计信息时排除某些观察结果而不在R中创建新数据框

时间:2014-02-19 20:14:12

标签: r statistics summary

我的问题是:

我有大量的数字变量需要生成汇总统计信息。一些观察结果被编码为“-99”,这意味着参与者不知道调查问题的答案。

在计算这些变量的方法时,我想排除“-99”观察值。由于我有很多变量,使用“子集”会非常繁重。

有人知道更简单的方法吗?

PS:我知道对于因素,FSA包中的> - Summarize(df,exclude =“”)命令可以正常工作。我只是不确定是否有数字变量的等价物。

1 个答案:

答案 0 :(得分:1)

围绕summary创建一个简单的包装函数:

set.seed(1)
x <- rnorm(100)
x[sample(seq_along(x), 10)] <- -99
summary2 <- function(x) summary(x[x!=-99])

比较结果:

> summary(x)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
-99.00000  -0.70810  -0.04209  -9.79400   0.59810   2.40200

> summary2(x)
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
-2.21500 -0.52640  0.07445  0.11770  0.67230  2.40200