从数字数据框中删除字符列

时间:2013-07-25 15:59:06

标签: r

我有一个像你在这里看到的数据框。

     DRSi       TP        DOC        DN          date     Turbidity   Anions 
     158        5.9       3371       264        14/8/06      5.83    2246.02
     217        4.7       2060       428        16/8/06      6.04    1632.29
     181        10.6      1828       219        16/8/06      6.11    1005.00
     397        5.3       1027       439        16/8/06      5.74    314.19
     2204       81.2      11770      1827       15/8/06      9.64    2635.39
     307        2.9       1954       589        15/8/06      6.12    2762.02
     136        7.1       2712       157        14/8/06      5.83    2049.86
     1502       15.3      4123       959        15/8/06      6.48    2648.12
     1113       1.5       819        195        17/8/06      5.83    804.42
     329        4.1       2264       434        16/8/06      6.19    2214.89
     193        3.5       5691       251        17/8/06      5.64    1299.25
     1152       3.5       2865       1075       15/8/06      5.66    2573.78
     357        4.1       5664       509        16/8/06      6.06    1982.08
     513        7.1       2485       586        15/8/06      6.24    2608.35
     1645       6.5       4878       208        17/8/06      5.96    969.32

在我到达此处之前,我使用以下代码删除那些根本没有值或某些NA的列。

    rem = NULL
    for(col.nr in 1:dim(E.3)[2]){
      if(sum(is.na(E.3[, col.nr]) > 0 | all(is.na(E.3[,col.nr])))){
        rem = c(rem, col.nr)
      }
    }
    E.4 <- E.3[, -rem]  

现在我需要删除“date”列,但不是基于它的列名,而是基于它是一个字符串的事实。

我在这里看到(Remove an entire column from a data.frame in R)已经如何简单地将其设置为NULL和其他选项,但我想使用不同的参数。

2 个答案:

答案 0 :(得分:12)

首先使用is.character查找类character的所有列。但是,请确保您的日期确实是character,而不是Datefactor。否则,请使用is.Dateis.factor代替is.character

然后只是将data.frame中不是字符的列进行子集化,例如

df[, !sapply(df, is.character)]

答案 1 :(得分:3)

我遇到了类似的问题,但上面的答案并没有解决日期列(这就是我需要的),所以我找到了另一个解决方案:

df[,-grep ("Date|factor|character", sapply (df, class))]

如果没有日期,字符和系数列,则会返回您的df。