总结列表中数据框的方式

时间:2017-06-23 15:28:09

标签: r dplyr summarize

我在列表中有一些数据框,所有数据框都具有相同的结构 - 在本例中是变量a,b和c。现在我想总结列表中值的方法。

# list of 10 random data frames
n <- 1e1
initSeed <- 1234
set.seed(initSeed)
(seedVec <- sample.int(n = 1e3, size = n, replace = FALSE))
lst <- lapply(1:n, function(i){
  set.seed(seedVec[i])
a <- rnorm(24,1,.1)
b <- rnorm(24,2,.2)
c <- rnorm(24,3,.3)
df <- data.frame(a,b,c)
})

我尝试用lst %>% summarize_all(mean)提供dplyr,但他不喜欢列表。下面的公式为我提供了列表中每个数据框的方法,但还没有提供所有数据框中这些变量a,b和c的均值。

lapply(1:10, function(n){
  lst[n] %>%
    data.frame() %>%
    summarize_all(mean)
})

所以我想创建一个包含汇总输出的新数据框,以便再次对它们进行汇总,但这失败了,我的扩展公式和related answer都抛出了Error in lst[[idx]] : subscript out of bounds 这是我的尝试:

df1 <- as.data.frame(setNames(replicate(3,numeric(0), simplify = FALSE), 
                                 letters[1:3]))
lapply(1:10, function(n){
  lst[n] %>%
    data.frame() %>%
    summarize_all(mean) %>%
    rbind(df1, lst[n])
})

df1 %>% summarize_all(mean)

我怎么能得到我想要的东西?

1 个答案:

答案 0 :(得分:2)

您可以使用GetLParam()

执行此操作
purrr

或者在基地R ......

purrr::map_df(lst, function(df){summarize_all(df,mean)})

           a        b        c
1  0.9917488 1.995821 3.121970
2  1.0007174 2.029938 2.962271
3  0.9582000 2.007167 3.046708
4  0.9745993 1.938877 3.015066
5  1.0050672 1.932359 3.052645
6  1.0196390 2.034723 2.998995
7  0.9717243 1.914532 3.024200
8  0.9954225 1.991664 2.981958
9  1.0148424 1.975775 2.949854
10 1.0014377 2.023839 2.976223