从我的R数据中删除恼人的“NA”条目(rm.na = TRUE无效!)

时间:2014-03-09 21:23:02

标签: r tapply

我有一些我想要分析的数据。我有两个变量 - 一个是是或否类型问题,另一个有许多可能的答案(但是分类 - 如“完全没有,有点,中立,很多,100%”)。

我想用tapply计算比例。我不知道该怎么做。我知道如何计算均值,如下:

tapply(dataset$variable1, dataset$variable2, mean)

无论如何,我不知道如何获得比例而不是像这样的意思,但除此之外,当我尝试得到平均值时,我得到:  0 1 NA NA 因为我的数据显然有NA答案。我尝试添加“rm.na = TRUE”值,但这并没有解决它。那么如何摆脱这些NA呢?或者还有另一种方法可以计算这样的比例吗? (计算:对问题变量1回答“是”的人中有多少比例对问题变量2也回答了3?)

1 个答案:

答案 0 :(得分:0)

我认为你需要使用tapply(na.omit(dataset $ variable1),na.omit(dataset $ variable2),mean)

DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA))
DF
  x  y
1 1  0
2 2 10
3 3 NA
na.omit(DF)
  x  y
1 1  0
2 2 10