我有两个看起来很难合并的数据集。
我已经尝试过:
ndf <- merge(df1, df2, by=c("state", "year"))
,但最终得到一个具有200,000个观察值的数据框。这是我的两个示例数据集,“收入”和“本地收入”列中df1为空:
df1 df2
state year income local_income state year income local_income
CA 1992 CA 1992 1 1
CA 1993 NV 1992 4 3
CA 1994 CO 1992 3 2
CA 1995
CA 1996
NV 1992
NV 1993
NV 1994
NV 1995
NV 1996
CO 1992
CO 1993
CO 1994
CO 1995
CO 1996
基本上我想做的是合并这两个数据集,如下所示:
df3
state year income local_income
CA 1992 1 1
CA 1993
CA 1994
CA 1995
CA 1996
NV 1992 4 3
NV 1993
NV 1994
NV 1995
NV 1996
CO 1992 3 2
CO 1993
CO 1994
CO 1995
CO 1996
然后,我最终将继续进行合并。但这是让我前进的一个好开始。任何帮助将不胜感激!否则,这将花费我8个多小时来处理我拥有的所有数据,因此,我很高兴看到r及其社区的力量!
答案 0 :(得分:0)
您也可以尝试dplyr版本。
this