如何将列表中的数据框加在一起,但仅用于匹配日期

时间:2019-02-27 01:52:45

标签: r purrr

我有一个数据框列表,我想将这些数据框合并为一个数据框。我正在寻求解决两个问题:

  1. 如何将各列加在一起
  2. 如何仅在列表中包括所有df中的公共日期

这就是我所拥有的:

library(tidyverse)
library(lubridate)

df1 <- data.frame(
               date = ymd(c("2019-02-01", "2019-02-02", "2019-02-03", "2019-02-04",
                        "2019-02-05")),
                  x = c(1, 2, 3, 4, 5),
                  y = c(2, 3, 4, 5, 6),
                  z = c(3, 4, 5, 6, 7)
       ) 


df2 <- data.frame(
               date = ymd(c("2019-02-01", "2019-02-02", "2019-02-04", "2019-02-05")),
                  x = c(1, 2, 3, 4),
                  y = c(2, 3, 4, 5),
                  z = c(3, 4, 5, 6)
       )

df3 <- data.frame(
               date = ymd(c("2019-02-01", "2019-02-02", "2019-02-03", "2019-02-04")),
                  x = c(1, 2, 3, 4),
                  y = c(2, 3, 4, 5),
                  z = c(3, 4, 5, 6)
       )


dfl <- list(df1, df2, df3)

这是我正在寻找的输出:

data.frame(
        date = ymd(c("2019-02-01", "2019-02-02", "2019-02-04")),
           x = c(3, 6, 11),
           y = c(6, 9, 14),
           z = c(9, 12, 17)
)

我尝试过inner_join并尝试遍历列表,但是它太复杂了,我仍然没能找到答案。 有没有更清洁的方法来获得最终答案

1 个答案:

答案 0 :(得分:2)

怎么样?

bind_rows(dfl) %>%
    group_by(date) %>%
    mutate(n = 1) %>%
    summarise_all(sum) %>%
    filter(n == length(dfl)) %>%
    select(-n)
## A tibble: 3 x 4
#  date           x     y     z
#  <date>     <dbl> <dbl> <dbl>
#1 2019-02-01     3     6     9
#2 2019-02-02     6     9    12
#3 2019-02-04    11    14    17

这假定date的单个data.frame中没有重复的dfl