我有一个包含100个变量的数据框,其中我想要一个子集,比如dataframename [,30:50]要转换为它们的原始数值(1,2,3,4,5)。
我知道在转换因子时我应该使用as.numeric(levels(f))[f]
,但我只能在一次转换因子时才能使用。我想立刻转换它们。
这不起作用:
as.numeric(levels(dataframename[,30:50]))[dataframename[,30:50]]
这两者都不会:
sapply(dataframename[,30:50],as.numeric(levels(dataframename[,30:50]))
[dataframename[,30:50]]
我应该阅读的任何想法或内容?
答案 0 :(得分:6)
这是一个较小的例子,但这个想法应该成立。您可以使用lapply
将转化应用于数据框的每一列,然后直接替换这些列。
# make example data
dat <- as.data.frame(lapply(as.data.frame(matrix(seq(2*3), ncol = 3)), factor))
factorconvert <- function(f){as.numeric(levels(f))[f]}
dat[, 2:3] <- lapply(dat[, 2:3], factorconvert)
dat
# V1 V2 V3
#1 1 3 5
#2 2 4 6
#str(dat)
#'data.frame': 2 obs. of 3 variables:
# $ V1: Factor w/ 2 levels "1","2": 1 2
# $ V2: num 3 4
# $ V3: num 5 6
答案 1 :(得分:1)
我喜欢@Dason
的答案。有一种方法只能在一行中执行此操作,您只需将解除因子应用于感兴趣的列并使用匿名函数,例如:
dataframename[,30:50] <- lapply(dataframename[,30:50], function(f) as.numeric(levels(f))[f])
请注意,列不必是连续的,即您可以使用典型的c(col1:col10,col20)子集化语法。