如何通过两个公共列合并两个数据集?

时间:2019-08-12 11:12:36

标签: r merge

我有两个看起来很难合并的数据集。

我已经尝试过:

ndf <- merge(df1, df2, by=c("state", "year")) 

,但最终得到一个具有200,000个观察值的数据框。这是我的两个示例数据集,“收入”和“本地收入”列中df1为空:

df1                                  df2
state year  income  local_income     state year  income local_income
CA    1992                           CA    1992   1       1 
CA    1993                           NV    1992   4       3
CA    1994                           CO    1992   3       2
CA    1995                           
CA    1996 
NV    1992 
NV    1993 
NV    1994 
NV    1995 
NV    1996 
CO    1992 
CO    1993
CO    1994
CO    1995
CO    1996


基本上我想做的是合并这两个数据集,如下所示:

df3
state year  income  local_income     
CA    1992  1         1              
CA    1993                           
CA    1994                          
CA    1995                           
CA    1996 
NV    1992  4         3
NV    1993 
NV    1994 
NV    1995 
NV    1996 
CO    1992  3         2
CO    1993
CO    1994
CO    1995
CO    1996

然后,我最终将继续进行合并。但这是让我前进的一个好开始。任何帮助将不胜感激!否则,这将花费我8个多小时来处理我拥有的所有数据,因此,我很高兴看到r及其社区的力量!

1 个答案:

答案 0 :(得分:0)

您也可以尝试dplyr版本。

this
相关问题