我有一个带有一些字符变量和数字/整数变量的data.table
,我想识别一个字符类型的变量,然后运行tolower
函数来修改大小写。这是我正在做的事情,但它似乎没有完成类型检查只对字符变量进行操作:
set.seed(426)
dt <- data.table(a = runif(5), b = sample(LETTERS, 5))
dt
a b
1: 0.8472276 Y
2: 0.1567767 J
3: 0.9817384 L
4: 0.2250681 S
5: 0.5994389 H
sapply(dt, class)
a b
"numeric" "character"
dt2 <- as.data.table(sapply(dt, function(n){
if(class(n) == "character"){
n <- tolower(n)
} else{
n
}
}))
dt2
a b
1: 0.847227579215541 y
2: 0.156776716466993 j
3: 0.981738423462957 l
4: 0.225068145431578 s
5: 0.599438918055966 h
sapply(dt2, class)
a b
"character" "character"
我是申请家庭的新手,感谢任何见解
答案 0 :(得分:2)
sapply
尝试返回矩阵时,所有变量都被强制转换为字符。由于您无法在矩阵中包含多个变量类型,因此所有变量都将转换为字符。为避免这种情况,您可以使用lapply
。
要获得更多数据。可以接近这一点的方法,弗兰克提供,你可以做到
# Find character columns
cols = names(dt)[sapply(dt, is.character)] # or which(sapply(dt, is.character))
# set these columns to lower
dt[, (cols) := lapply(.SD, tolower), .SDcols=cols]
或者
dt[, lapply(.SD, function(x) if(is.character(x)) tolower(x) else x)]