在一个表中汇总来自多个数据框的相同变量

时间:2019-05-12 16:32:29

标签: r datatable stargazer

我有来自几个数据集的选民和政党数据,我进一步将其分为不同的数据框和列表以使其具有可比性。我可以只对它们分别使用summary命令,然后手动进行比较,但是我想知道是否有一种方法可以将它们组合在一起并放在一张桌子中?

以下是我所拥有的示例:

> summary(eco$rilenew)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
      3       4       4       4       4       5 
> summary(ecovoters)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
  0.000   3.000   4.000   3.744   5.000  10.000      26 
> summary(lef$rilenew)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  2.000   3.000   3.000   3.692   4.000   7.000 
> summary(lefvoters)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
  0.000   2.000   3.000   3.612   5.000  10.000     332
> summary(soc$rilenew)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  2.000   4.000   4.000   4.143   5.000   6.000 
> summary(socvoters)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
  0.000   3.000   4.000   3.674   5.000  10.000     346 

有没有一种方法可以将这些列表(ecovoters,lefvoters,socvoters等)和数据帧变量(eco $ rilenew,lef $ rilenew,soc $ rilenew等)汇总在一起,并将它们放在一个表中?

2 个答案:

答案 0 :(得分:0)

您可以将所有内容放入列表中,并使用一个小的自定义函数进行总结。

L <- list(eco$rilenew, ecovoters, lef$rilenew, 
          lefvoters, soc$rilenew, socvoters)

t(sapply(L, function(x) {
  s <- summary(x)
  length(s) <- 7
  names(s)[7] <- "NA's"
  s[7] <- ifelse(!any(is.na(x)), 0, s[7])
  return(s)
  }))
           Min.   1st Qu.   Median     Mean  3rd Qu.      Max. NA's
[1,]  0.9820673 3.3320662 3.958665 3.949512 4.625109  7.229069    0
[2,] -4.8259384 0.5028293 3.220546 3.301452 6.229384  9.585749   26
[3,] -0.3717391 2.3280366 3.009360 3.013908 3.702156  6.584659    0
[4,] -2.6569493 1.6674330 3.069440 3.015325 4.281100  8.808432  332
[5,] -2.3625651 2.4964361 3.886673 3.912009 5.327401 10.349040    0
[6,] -2.4719404 1.3635785 2.790523 2.854812 4.154936  8.491347  346

数据

set.seed(42)
eco <- data.frame(rilenew=rnorm(800, 4, 1))
ecovoters <- rnorm(75, 4, 4)
ecovoters[sample(length(ecovoters), 26)] <- NA
lef <- data.frame(rilenew=rnorm(900, 3, 1))
lefvoters <- rnorm(700, 3, 2)
lefvoters[sample(length(lefvoters), 332)] <- NA
soc <- data.frame(rilenew=rnorm(900, 4, 2))
socvoters <- rnorm(700, 3, 2)
socvoters[sample(length(socvoters), 346)] <- NA

答案 1 :(得分:0)

可以使用# Remove all .pyc files in the current git project find $(git rev-parse --show-cdup) -name "*.pyc" -delete # Completely reinstall the project pip install --upgrade --force-reinstall --editable . 中的map来获取摘要列表,然后,如果您希望将结果作为数据框,那么tidyverse可以帮助将列表转换为数据框:

plyr::ldply