使用as.numeric将数据帧中的因子子集转换为数字(级别(f))[f]

时间:2012-10-12 22:46:36

标签: r syntax

我有一个包含100个变量的数据框,其中我想要一个子集,比如dataframename [,30:50]要转换为它们的原始数值(1,2,3,4,5)。

我知道在转换因子时我应该使用as.numeric(levels(f))[f],但我只能在一次转换因子时才能使用。我想立刻转换它们。

这不起作用:

as.numeric(levels(dataframename[,30:50]))[dataframename[,30:50]]  

这两者都不会:

sapply(dataframename[,30:50],as.numeric(levels(dataframename[,30:50]))    
[dataframename[,30:50]]  

我应该阅读的任何想法或内容?

2 个答案:

答案 0 :(得分:6)

这是一个较小的例子,但这个想法应该成立。您可以使用lapply将转化应用于数据框的每一列,然后直接替换这些列。

# make example data
dat <- as.data.frame(lapply(as.data.frame(matrix(seq(2*3), ncol = 3)), factor))

factorconvert <- function(f){as.numeric(levels(f))[f]}
dat[, 2:3] <- lapply(dat[, 2:3], factorconvert)
dat
#  V1 V2 V3
#1  1  3  5
#2  2  4  6
#str(dat)
#'data.frame':  2 obs. of  3 variables:
# $ V1: Factor w/ 2 levels "1","2": 1 2
# $ V2: num  3 4
# $ V3: num  5 6

答案 1 :(得分:1)

我喜欢@Dason的答案。有一种方法只能在一行中执行此操作,您只需将解除因子应用于感兴趣的列并使用匿名函数,例如:

dataframename[,30:50] <- lapply(dataframename[,30:50], function(f) as.numeric(levels(f))[f])

请注意,列不必是连续的,即您可以使用典型的c(col1:col10,col20)子集化语法。