我正在R中的一个项目上工作。我在两个数据框中都有两个数据框,每个员工ID都有多个条目。也就是说,例如,员工ID 1在表1和表2中具有多个条目。因此,这些表中没有主键。
我想合并这两个表以进行更好的分析。当我尝试合并这些表时,它会计算每个ID的排列并扭曲结果表中的数据。
有人可以建议出路吗?
答案 0 :(得分:0)
您可以使用merge
命令合并两个表。
by = "employeeid"
使您可以指定键列。如果您有多个列by = c("emoloyeeid", "period")
table3 <- merge(table1, table2, by = "employeeid")
?merge
将为您提供更多选择。
答案 1 :(得分:0)
我正在R中的一个项目上工作。我在两个数据框中都有两个数据框,每个员工ID都有多个条目。也就是说,例如,员工ID 1在表1和表2中具有多个条目。因此,这些表中没有主键。
一种想法是处理数据,以便不再有多个条目。
另一种方法是汇总您的数据,以便每个员工表中每个员工只有一行。
第三种是使用完全联接来连接所有匹配的ID
https://dplyr.tidyverse.org/reference/join.html
library(dplyr)
full_join(df1, df2, by = "EmployeeID")
查看DPLYR“数据转换备忘单” https://github.com/rstudio/cheatsheets/raw/master/data-transformation.pdf