我的问题是:
我有大量的数字变量需要生成汇总统计信息。一些观察结果被编码为“-99”,这意味着参与者不知道调查问题的答案。
在计算这些变量的方法时,我想排除“-99”观察值。由于我有很多变量,使用“子集”会非常繁重。
有人知道更简单的方法吗?
PS:我知道对于因素,FSA包中的> - Summarize(df,exclude =“”)命令可以正常工作。我只是不确定是否有数字变量的等价物。
答案 0 :(得分:1)
围绕summary
创建一个简单的包装函数:
set.seed(1)
x <- rnorm(100)
x[sample(seq_along(x), 10)] <- -99
summary2 <- function(x) summary(x[x!=-99])
比较结果:
> summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-99.00000 -0.70810 -0.04209 -9.79400 0.59810 2.40200
> summary2(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-2.21500 -0.52640 0.07445 0.11770 0.67230 2.40200