为什么apply()不适用于R中的数据帧?

时间:2014-01-14 09:01:57

标签: r apply

我有一个名为“成人”的数据框

> str(adult[, 1:2)
'data.frame':   32561 obs. of  15 variables:
 $ age      : int  39 50 38 53 28 37 49 52 31 42 ...
 $ worktp   : Factor w/ 9 levels " ?"," Federal-gov",..: 8 7 5 5 5 5 5 7 5 5 ...

> is.factor(adult[,1])
[1] FALSE

> is.factor(adult[,2])
[1] TRUE

在我使用

之前一切正常
> apply(adult[,1:2], 2, function(x) is.factor(x))
age worktp 
FALSE  FALSE 

为什么我在worktp上得到FALSE,其中is.factor()只是给了我真的?我真的需要这个apply()函数来处理我的数据帧。我应该使用其他一些与应用相关的功能吗?

谢谢!

1 个答案:

答案 0 :(得分:6)

apply会在处理之前将您的数据转换为矩阵(请参阅?apply中的详细信息部分)。在此步骤中,因子信息将丢失。

d <- data.frame(num=1:4, fac=factor(1:4))
d[, 2]
[1] 1 2 3 4
Levels: 1 2 3 4        # levels, hence a factor

m <- as.matrix(d)
m[, 2]
[1] "1" "2" "3" "4"     # no levels anymore

apply(d, 2, is.factor)

  num   fac 
FALSE FALSE             # no factors as converted to matrix

要获得您想要的内容,可以使用lapply

lapply(d, is.factor)
$num
[1] FALSE

$fac
[1] TRUE

sapply

sapply(d, is.factor)
  num   fac 
FALSE  TRUE