我正在尝试删除第3列为NA的数据框中的所有行:
new.frame <- data[(!is.na(data$z)),]
但我收到了一个错误。
Warning message:
In is.na(data$z) : is.na() applied to non-(list or vector) of type 'NULL'
我该如何做到这一点?
答案 0 :(得分:9)
请重复的例子。这是一个有效的方法:
R> set.seed(42)
R> DF <- data.frame(a=rnorm(10), b=sample(LETTERS, 10, replace=TRUE),
+> z=cumsum(runif(10)))
R> DF[c(2,4,6),"z"] = NA
R> DF
a b z
1 1.3709584 X 0.737596
2 -0.5646982 D NA
3 0.3631284 Z 1.936759
4 0.6328626 Y NA
5 0.4042683 C 2.625877
6 -0.1061245 N NA
7 1.5115220 K 3.466127
8 -0.0946590 X 3.673786
9 2.0184237 L 4.580388
10 -0.0627141 V 5.192166
R> new.frame <- DF[(!is.na(DF$z)),]
R> new.frame
a b z
1 1.3709584 X 0.737596
3 0.3631284 Z 1.936759
5 0.4042683 C 2.625877
7 1.5115220 K 3.466127
8 -0.0946590 X 3.673786
9 2.0184237 L 4.580388
10 -0.0627141 V 5.192166
R>
答案 1 :(得分:3)
还有complete.cases()
可能更容易阅读。使用Dirk的数据:
new.frame2 <- DF[complete.cases(DF) ,]
> all.equal(new.frame, new.frame2)
[1] TRUE
答案 2 :(得分:1)
您还可以在整个数据集中使用 na.omit 功能。
答案 3 :(得分:0)
试试这个:
new.frame.nonull <- data[(!is.null(data$z)),]
new.frame <- new.frame.nonull[(!is.na(new.frame.nonull$z)),]