创建一个组合键并在R中合并两个表

时间:2018-08-27 13:58:57

标签: r

我正在R中的一个项目上工作。我在两个数据框中都有两个数据框,每个员工ID都有多个条目。也就是说,例如,员工ID 1在表1和表2中具有多个条目。因此,这些表中没有主键。

我想合并这两个表以进行更好的分析。当我尝试合并这些表时,它会计算每个ID的排列并扭曲结果表中的数据。

有人可以建议出路吗?

2 个答案:

答案 0 :(得分:0)

您可以使用merge命令合并两个表。

by = "employeeid"使您可以指定键列。如果您有多个列by = c("emoloyeeid", "period")

table3 <- merge(table1, table2, by  = "employeeid")

?merge将为您提供更多选择。

答案 1 :(得分:0)

  

我正在R中的一个项目上工作。我在两个数据框中都有两个数据框,每个员工ID都有多个条目。也就是说,例如,员工ID 1在表1和表2中具有多个条目。因此,这些表中没有主键。

一种想法是处理数据,以便不再有多个条目。

另一种方法是汇总您的数据,以便每个员工表中每个员工只有一行。

第三种是使用完全联接来连接所有匹配的ID

https://dplyr.tidyverse.org/reference/join.html

library(dplyr)
full_join(df1, df2, by = "EmployeeID")

查看DPLYR“数据转换备忘单” https://github.com/rstudio/cheatsheets/raw/master/data-transformation.pdf