将函数应用于data.frame的每一列并组织输出

时间:2018-12-07 14:54:34

标签: r function dataframe apply sapply

我有这个向量:

 x <- c(5,2,-4,-6,-2,1,4,2,-3,-6,-1,8,9,5,-6,-11)

我使用此功能:

myfunction <- function(x){
     n <- length(x)
     fx <- numeric(n)
     fx[1] <- min(x[1],0)
     for(i in 2:n){fx[i] <- min(0,fx[i-1]+x[i])}
     fx

     x_min <-min(x)
     fx_min <- min(fx)

     fx_05 <- numeric(n)
     fx_05[1] <- min(fx[1],0)
     for (i in 2:n) {
       if (sum(fx_05[i-1]+x[i])>0) {  
          fx_05[i] <- 0
       } else if ((sum(fx_05[i-1]+x[i]))<(fx_min*0.5)) {
          fx_05[i] <- (fx_min*0.5)
       } else { fx_05[i] <- sum(fx_05[i-1]+x[i]) }
     }
     fx_05
     as.data.frame(matrix(c(x, fx_05), ncol = 2 ))
}
xx <- myfunction(x)

数据帧xx

    V1   V2
1    5  0.0
2    2  0.0
3   -4 -4.0
4   -6 -8.5
5   -2 -8.s
6    1 -7.5
7    4 -3.5
8    2 -1.5
9   -3 -4.5
10  -6 -8.5
11  -1 -8.5
12   8 -0.5
13   9  0.0
14   5  0.0
15  -6 -6.0
16 -11 -8.5`

我想将此功能应用于data.frame:

df <- data.frame(x <- c(5,2,-4,-6,-2,1,4,2,-3,-6,-1,8,9,5,-6,-11),
                   y <- c(5,2,-4,-6,-2,1,4,2,-3,-6,-1,8,9,5,-6,-11),
                   z <- c(5,2,-4,-6,-2,1,4,2,-3,-6,-1,8,9,5,-6,-11))

使用:

output <- myfunction(df) 

它不起作用,并使用:

outputs <- data.frame(sapply(df, myfunction))

data.frame输出的格式不正确。 data.frame的每个原始列应为2列。

1 个答案:

答案 0 :(得分:2)

在这种情况下,您想使用lapply。因为它实际上是等长向量的列表,它将处理data.frame的每一列,并分别返回两列data.frame。

x <- lapply(df, myfunction)

此外,sapply也可以正常工作。唯一的区别是,一开始它看起来有所不同。有关所有解决方案之间的区别,请参见print(x)

x <- sapply(df, myfunction)

之后,您可能希望再次将它们从列表组合到data.frame。您可以使用do.call

df2 <- do.call(cbind, x)

这会弄乱列名。您可以使用names

进行更改
names(df2) <- NULL
df2
# 1    5  0.0   5  0.0   5  0.0
# 2    2  0.0   2  0.0   2  0.0
# 3   -4 -4.0  -4 -4.0  -4 -4.0
# 4   -6 -8.5  -6 -8.5  -6 -8.5
# ....

旁注:

如果没有data.frame而是矩阵作为输入,则另一个选项为apply,带有MARGIN = 2

x <- apply(df, MARGIN = 2, myfunction)

尽管在本示例中,它也能正常工作,但是在向量中具有不同数据类型时,您会遇到麻烦,因为在应用该函数之前它将data.frame转换为矩阵。因此,不建议这样做。有关更多信息,请参见this detailed and easy-to-understand post

进一步阅读:
Hadley Wickham's Advanced R。还可以在此站点上查看有关数据类型的部分。
Peter Werner's blog post


我非常感谢@Gregor在本文中的投入。