按行具有不同行长度的两个数据帧

时间:2018-03-12 10:06:00

标签: r dataframe join plyr

我正在使用R plyr的{​​{1}}函数按某些税收协定的列“国家/地区”和“年份”加入两个数据框。但是,两个数据帧的“国家”和“年”列具有不同长度,具有不同数量的唯一值,如下所示。 join() df1

=

虽然country year treaty_id A 1995 1 B 1995 1 C 1995 1 D 1995 1 A 2001 2 B 2001 2 D 2001 2 C 2015 3 D 2015 3 具有“国家/地区”和“年”值的完整列表

df2

表示“国家”A至H和“年”1992至2015年。 是否有country year A 1992 B 1992 C 1992 D 1992 E 1992 F 1992 G 1992 H 1992 A 1993 B 1993 C 1993 … … G 2015 H 2015 df1匹配df2中给出的“年份”信息(签署特定税收协定时),并将国家/地区列表从A扩展为H df1。 (由于同年签署的条约可能不止一个,因此需要按treaty_id分组) 这样我就可以生成另一个虚拟变量treaty_id来表明每个国家在税收协定中的成员身份。输出应该看起来像这样

member

如果有人能在这方面给我启发,我们将非常感激。

0 个答案:

没有答案