R:NA尽管返回了!is.na

时间:2016-07-13 15:16:21

标签: r dataframe na row-number rowname

我有一个简单的数据框:

> df <- data.frame(i=c(1:20), x=c(1:10, rep(NA, 10)))
> df
    i  x
1   1  1
2   2  2
3   3  3
4   4  4
5   5  5
6   6  6
7   7  7
8   8  8
9   9  9
10 10 10
11 11 NA
12 12 NA
13 13 NA
14 14 NA
15 15 NA
16 16 NA
17 17 NA
18 18 NA
19 19 NA
20 20 NA

我想提取非NA部分的rownames,我可以这样做:

> rownames(df[c(1:20),][!is.na(df$x),])
 [1] "1"  "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10"

到目前为止一切顺利。现在我想跳过第一行,但由于某种原因,该命令返回相同的长度输出,现在甚至包含一个NA单元格。

> rownames(df[c(2:20),][!is.na(df$x),])
 [1] "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10" "11"

获得相同大小的矢量甚至包含所谓的排除行的矢量是没有意义的。 正如你在上面的数据框中看到的那样,df $ x [11]肯定是NA,所以为什么它包含了什么!is.na()通常应该摆脱?更具体一点:我试图观察数据框的摘录,但排除包含NA的行。我会对每一条建议感到高兴!

2 个答案:

答案 0 :(得分:3)

我们可以直接从逻辑输出中提取rownames

tail(rownames(df)[!is.na(df$x)], -1)
#[1] "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10"

或者代替tail,我们可以使用

rownames(df)[!is.na(df$x)][-1]
#[1] "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10"

答案 1 :(得分:2)

问题是!is.na(df$x)已编入df,而非df[c(2:20)!is.na(df$x)对于前10个元素是正确的。因此,rownames(df[c(2:20),][!is.na(df$x),])会返回df的元素2到11的rownames。

df2 <- df[c(2:20),]
rownames(df2[!is.na(df2$x),])    

# [1] "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10"