使用`apply`来修改`tolower`的字符串

时间:2017-03-30 21:04:47

标签: r string data.table sapply

我有一个带有一些字符变量和数字/整数变量的data.table,我想识别一个字符类型的变量,然后运行tolower函数来修改大小写。这是我正在做的事情,但它似乎没有完成类型检查只对字符变量进行操作:

set.seed(426)
dt <- data.table(a = runif(5), b = sample(LETTERS, 5))

dt
           a b
1: 0.8472276 Y
2: 0.1567767 J
3: 0.9817384 L
4: 0.2250681 S
5: 0.5994389 H

sapply(dt, class)
        a           b 
"numeric" "character"

dt2 <- as.data.table(sapply(dt, function(n){
    if(class(n) == "character"){
            n <- tolower(n)
    } else{
            n 
    }
}))

dt2
                   a b
1: 0.847227579215541 y
2: 0.156776716466993 j
3: 0.981738423462957 l
4: 0.225068145431578 s
5: 0.599438918055966 h

sapply(dt2, class)
          a           b 
"character" "character" 

我是申请家庭的新手,感谢任何见解

1 个答案:

答案 0 :(得分:2)

sapply尝试返回矩阵时,所有变量都被强制转换为字符。由于您无法在矩阵中包含多个变量类型,因此所有变量都将转换为字符。为避免这种情况,您可以使用lapply

要获得更多数据。可以接近这一点的方法,弗兰克提供,你可以做到

# Find character columns
cols = names(dt)[sapply(dt, is.character)] # or which(sapply(dt, is.character)) 
# set these columns to lower
dt[, (cols) := lapply(.SD, tolower), .SDcols=cols]

或者

dt[, lapply(.SD, function(x) if(is.character(x)) tolower(x) else x)]