比较R中的3个不同的.csv文件,并将它们之间的公共数据提取到新的.csv

时间:2017-06-16 17:46:10

标签: r csv shiny data-science

我有一个场景,我想比较3个不同的.csv文件,并将其中常见的数据提取/写入第4个文件。任何人都可以告诉我如何在R中实现这一点。

1 个答案:

答案 0 :(得分:0)

您可以使用dplyr在一个管道中执行所有操作。

如果您正在寻找能够找到所有.csv文件中存在的观察结果的解决方案,您应该使用内部联接:

library(dplyr)
library(magrittr)

read.csv("first.csv") %>%
  inner_join(read.csv("second.csv")) %>%
  inner_join(read.csv("third.csv")) %>%
  write.csv("fourth.csv", quote = F, row.names = F)

如果您正在寻找能够找到任何数据框中存在的所有观察结果的解决方案,那么您应该使用完全加入:

read.csv("first.csv") %>%
  full_join(read.csv("second.csv")) %>%
  full_join(read.csv("third.csv")) %>%
  write.csv("fourth.csv", quote = F, row.names = F)