如何删除缺少数据的案例,具体取决于是否缺少特定数量的变量?

时间:2017-09-12 21:40:36

标签: r

我有一个大型数据集,有些案例在这里和那里都缺少一个变量,但我有一些案例,参与者根本没有回答任何问题,或只有1/150个问题。有没有办法摆脱缺少> x变量的案例,但保留案例

case k1   k2   k3
1    na   2    3
2    3    1    5
3    1    na   2
4    na   na   na

所以在这种情况下,我想要一个仅删除案例4的公式。有任何想法吗?

2 个答案:

答案 0 :(得分:0)

尝试使用此示例,其中您的矩阵命名为yourMatrix并且您允许<超过2个缺失值。

# Number of missing values to start removing cases
nMissing <- 2
foo <- apply(yourMatrix, 1, function(x) sum(is.na(x)))
yourMatrix[!foo >= nMissing, ]

答案 1 :(得分:0)

所以这对我来说最有效。

MyDataset2 <- MYDataset
nMissing <- 23
foo <- rowSums(is.na(MyDataset2))
MyDataset2 <- MyDataset2[!foo < nMissing, ]