如何选择具有某一列完整案例的数据?

时间:2012-09-12 17:44:08

标签: r

我正在尝试获取数据框(例如just.samples.with.shoulder.values)仅包含非NA值的样本。我试图使用complete.cases函数来完成这个,但我想我在语法上做了一些错误:

data <- structure(list(Sample = 1:14, Head = c(1L, 0L, NA, 1L, 1L, 1L, 
0L, 0L, 1L, 1L, 1L, 1L, 0L, 1L), Shoulders = c(13L, 14L, NA, 
18L, 10L, 24L, 53L, NA, 86L, 9L, 65L, 87L, 54L, 36L), Knees = c(1L, 
1L, NA, 1L, 1L, 2L, 3L, 2L, 1L, NA, 2L, 3L, 4L, 3L), Toes = c(324L, 
5L, NA, NA, 5L, 67L, 785L, 42562L, 554L, 456L, 7L, NA, 54L, NA
)), .Names = c("Sample", "Head", "Shoulders", "Knees", "Toes"
), class = "data.frame", row.names = c(NA, -14L))

just.samples.with.shoulder.values <- data[complete.cases(data[,"Shoulders"])]
print(just.samples.with.shoulder.values)

我也有兴趣知道其他一些路线(使用subset())是否是一个更明智的想法。非常感谢你的帮助!

3 个答案:

答案 0 :(得分:13)

您可以尝试使用is.na

data[!is.na(data["Shoulders"]),]
   Sample Head Shoulders Knees Toes
1       1    1        13     1  324
2       2    0        14     1    5
4       4    1        18     1   NA
5       5    1        10     1    5
6       6    1        24     2   67
7       7    0        53     3  785
9       9    1        86     1  554
10     10    1         9    NA  456
11     11    1        65     2    7
12     12    1        87     3   NA
13     13    0        54     4   54
14     14    1        36     3   NA

答案 1 :(得分:13)

您也可以尝试complete.cases,这会返回一个逻辑向量,允许按Shoulders

对数据进行子集化
data[complete.cases(data$Shoulders), ] 
#    Sample Head Shoulders Knees Toes
#  1      1    1        13     1  324
#  2      2    0        14     1    5
#  4      4    1        18     1   NA
#  5      5    1        10     1    5
#  6      6    1        24     2   67
#  7      7    0        53     3  785
#  9      9    1        86     1  554
# 10     10    1         9    NA  456
# 11     11    1        65     2    7
# 12     12    1        87     3   NA
# 13     13    0        54     4   54
# 14     14    1        36     3   NA

答案 2 :(得分:0)

使用is.na和complete.cases之间有细微的区别。 is.na会删除实际的na值,而此处的目的是仅控制变量,而不处理缺失值/ na可能是合法数据点的值