Question

我有两个看起来很难合并的数据集。

我已经尝试过：

ndf <- merge(df1, df2, by=c("state", "year"))

，但最终得到一个具有200,000个观察值的数据框。这是我的两个示例数据集，“收入”和“本地收入”列中df1为空：

df1                                  df2
state year  income  local_income     state year  income local_income
CA    1992                           CA    1992   1       1 
CA    1993                           NV    1992   4       3
CA    1994                           CO    1992   3       2
CA    1995                           
CA    1996 
NV    1992 
NV    1993 
NV    1994 
NV    1995 
NV    1996 
CO    1992 
CO    1993
CO    1994
CO    1995
CO    1996

基本上我想做的是合并这两个数据集，如下所示：

df3
state year  income  local_income     
CA    1992  1         1              
CA    1993                           
CA    1994                          
CA    1995                           
CA    1996 
NV    1992  4         3
NV    1993 
NV    1994 
NV    1995 
NV    1996 
CO    1992  3         2
CO    1993
CO    1994
CO    1995
CO    1996

然后，我最终将继续进行合并。但这是让我前进的一个好开始。任何帮助将不胜感激！否则，这将花费我8个多小时来处理我拥有的所有数据，因此，我很高兴看到r及其社区的力量！

Answer 1

您也可以尝试dplyr版本。

this

如何通过两个公共列合并两个数据集？

1 个答案: