我正在使用R plyr
的{{1}}函数按某些税收协定的列“国家/地区”和“年份”加入两个数据框。但是,两个数据帧的“国家”和“年”列具有不同长度,具有不同数量的唯一值,如下所示。
join()
df1
=
虽然country year treaty_id
A 1995 1
B 1995 1
C 1995 1
D 1995 1
A 2001 2
B 2001 2
D 2001 2
C 2015 3
D 2015 3
具有“国家/地区”和“年”值的完整列表
df2
表示“国家”A至H和“年”1992至2015年。
是否有country year
A 1992
B 1992
C 1992
D 1992
E 1992
F 1992
G 1992
H 1992
A 1993
B 1993
C 1993
… …
G 2015
H 2015
和df1
匹配df2
中给出的“年份”信息(签署特定税收协定时),并将国家/地区列表从A扩展为H df1
。 (由于同年签署的条约可能不止一个,因此需要按treaty_id
分组)
这样我就可以生成另一个虚拟变量treaty_id
来表明每个国家在税收协定中的成员身份。输出应该看起来像这样
member
如果有人能在这方面给我启发,我们将非常感激。