我有两个数据帧。一个像下面的
> head(df1)
dropOffZip hour transition Day7
1 622 0 72 1
2 04745 0 1 1
3 05823 0 1 1
4 06490 0 1 2
5 06807 0 1 2
第二个就像是:
head(df2)
dropOffZip Day7 hour Median Count
1 622 1 0 60 1
2 622 2 8 60 1
3 622 3 8 60 1
4 622 7 12 60 1
现在,我想根据df3
,df1
和df2
的共同价值合并dropOffZip
和Day7
来制作hour
。问题是虽然df1中提供了day,hour,dropOffZip的所有组合,但df2并非如此。因此,在合并的df3中,我仍然希望df1中缺少这些组合的行,但Median
和Count
的相应值应分配为0
。谁能建议如何实现这种合并?
最终的df3
应该是:
>head(df3)
dropOffZip Day7 hour Median Count Transition
1 622 1 0 60 1 72
2 04745 1 0 0 0 1
此处第二行提供Median = 0
和Count = 0
,因为我们在数据框dropOffZip
中没有04745
df2
的任何列
答案 0 :(得分:1)
尝试在合并中给出all = TRUE并使用complete.cases(df3)删除不需要的NA。否则添加一个名为median的新列并将其分配给NA。只需使用complete.cases对其进行rbind并使用NA删除不需要的行。