R在数据帧上应用函数

时间:2015-01-11 15:02:35

标签: r apply

我正在尝试应用此功能:

if.class <- function(data){
  as.data.frame(
  if (data == '[1, 4)')   '1'
  else if (data == '[4, 6)')  '2'
  else '3'
)
}

在整个数据帧上,以便将因子水平[1,4]和[4,6]转换为1或2或3。 数据框如下所示:

> dim(mnm.predict.test.class)
  [1] 5750    1
  > head(mnm.predict.test.class)
   predict(mnm, newdata = testing.logist, type = "class")
  1                                                 [1, 4)
  2                                                 [1, 4)
  3                                                 [1, 4)
  4                                                 [1, 4)
  5                                                 [1, 4)
  6                                                 [1, 4)

我正在使用这条线进行转换:

 mnm.predict.test.class.factors <- apply(mnm.predict.test.class,c(1,2),if.class)

然而,结果很奇怪:

 head(mnm.predict.test.class.factors)
 predict(mnm, newdata = testing.logist, type = "class")
 [1,] List,1                                                
 [2,] List,1                                                
 [3,] List,1                                                
 [4,] List,1                                                
 [5,] List,1                                                
 [6,] List,1   

为什么转型没有按预期运作的任何想法?

2 个答案:

答案 0 :(得分:2)

您可以使用levels功能更改factor的级别。例如,如果您有因子变量foo

foo <- factor(
  rep(c("[1, 4)","[4, 6)","[6, 7)","[7, 9)"),2))
R> foo
[1] [1, 4) [4, 6) [6, 7) [7, 9) [1, 4) [4, 6) [6, 7) [7, 9)
Levels: [1, 4) [4, 6) [6, 7) [7, 9)

你可以改变这样的水平

levels(foo) <- c("1","2","3","3")
R> foo
[1] 1 2 3 3 1 2 3 3
Levels: 1 2 3

在您的情况下,您有一列data.frame,因此它类似于

Df <- data.frame(
  foo = factor(
    rep(c("[1, 4)","[4, 6)",
          "[6, 7)","[7, 9)"),2)))
##
levels(Df[,1]) <- c("1","2","3","3")
R> str(Df)
'data.frame':   8 obs. of  1 variable:
 $ foo: Factor w/ 3 levels "1","2","3": 1 2 3 3 1 2 3 3

正如旁注,从你问题中head(mnm.predict.test.class.factors)的输出来看,看起来你的一列有一个笨拙的名字predict(mnm, newdata = testing.logist, type = "class") - 你可能想把它改成更合理的东西输入(例如names(mnm.predict.test.class.factors)[1] <- "myVar")。

答案 1 :(得分:2)

apply会返回array,从而返回您的输出。将其转换为data.frame,你就可以了:

#example data
df <- data.frame(a=rep('[1, 4)',50) )

> df
        a
1  [1, 4)
2  [1, 4)
3  [1, 4)
4  [1, 4)
5  [1, 4)
6  [1, 4)
7  [1, 4)
8  [1, 4)
9  [1, 4)

#just use your function as you used it but wrapped inside a data.frame function
df2 <-  data.frame(apply(df,c(1,2),if.class))

> df2
   a
1  1
2  1
3  1
4  1
5  1
6  1
7  1
8  1
9  1