Question

我正在处理一些RNA-seq计数数据，我有大约60,000个包含基因名称的列和24个包含样本名称的行。当我做了一些基因名称转换时，我留下了一堆名为NA的列。我知道R处理NA的方式与典型的列名不同，我的问题是如何删除这些列。以下是我的数据示例。

  "Gene1"  "Gene2"  "Gene3"  NA  "Gene4"
1  10       11       12      10   15
2  13       12       50      40   30
3  34       23       23      21   22

我希望它最终像

  "Gene1"  "Gene2"  "Gene3"  "Gene4"
1  10       11       12       15
2  13       12       50       30
3  34       23       23       22

我确实找到了一些适用于其他人但不适合我的R代码

df<-df[, grep("^(NA)", names(df), value = TRUE, invert = TRUE)]

Answer 1

您的姓名似乎有NA，而不是"NA"。前者表示缺失值，后者是一个字符串，看起来像代表缺失值的符号。使用：

df <- df[!is.na(names(df))]

使用iris进行说明：

> head(iris)
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa
> names(iris)[2:3] <- NA
> head(iris)
  Sepal.Length  NA  NA Petal.Width Species
1          5.1 3.5 1.4         0.2  setosa
2          4.9 3.0 1.4         0.2  setosa
3          4.7 3.2 1.3         0.2  setosa
4          4.6 3.1 1.5         0.2  setosa
5          5.0 3.6 1.4         0.2  setosa
6          5.4 3.9 1.7         0.4  setosa
> head(iris[!is.na(names(iris))])
  Sepal.Length Petal.Width Species
1          5.1         0.2  setosa
2          4.9         0.2  setosa
3          4.7         0.2  setosa
4          4.6         0.2  setosa
5          5.0         0.2  setosa
6          5.4         0.4  setosa

删除名为“NA”的列

1 个答案: