我有一些我想要分析的数据。我有两个变量 - 一个是是或否类型问题,另一个有许多可能的答案(但是分类 - 如“完全没有,有点,中立,很多,100%”)。
我想用tapply计算比例。我不知道该怎么做。我知道如何计算均值,如下:
tapply(dataset$variable1, dataset$variable2, mean)
无论如何,我不知道如何获得比例而不是像这样的意思,但除此之外,当我尝试得到平均值时,我得到: 0 1 NA NA 因为我的数据显然有NA答案。我尝试添加“rm.na = TRUE”值,但这并没有解决它。那么如何摆脱这些NA呢?或者还有另一种方法可以计算这样的比例吗? (计算:对问题变量1回答“是”的人中有多少比例对问题变量2也回答了3?)
答案 0 :(得分:0)
我认为你需要使用tapply(na.omit(dataset $ variable1),na.omit(dataset $ variable2),mean)
DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA))
DF
x y 1 1 0 2 2 10 3 3 NA
na.omit(DF)
x y 1 1 0 2 2 10