我有一个大型数据集,有些案例在这里和那里都缺少一个变量,但我有一些案例,参与者根本没有回答任何问题,或只有1/150个问题。有没有办法摆脱缺少> x变量的案例,但保留案例
case k1 k2 k3
1 na 2 3
2 3 1 5
3 1 na 2
4 na na na
所以在这种情况下,我想要一个仅删除案例4的公式。有任何想法吗?
答案 0 :(得分:0)
尝试使用此示例,其中您的矩阵命名为yourMatrix
并且您允许<超过2个缺失值。
# Number of missing values to start removing cases
nMissing <- 2
foo <- apply(yourMatrix, 1, function(x) sum(is.na(x)))
yourMatrix[!foo >= nMissing, ]
答案 1 :(得分:0)
所以这对我来说最有效。
MyDataset2 <- MYDataset
nMissing <- 23
foo <- rowSums(is.na(MyDataset2))
MyDataset2 <- MyDataset2[!foo < nMissing, ]