我目前正在尝试合并R中的两个数据集(使用Rstudio)。
第一个数据集是二元的,包括国家之间的双边贸易流量(dyad),来自战争相关数据集。第二个是宾夕法尼亚世界表中每个国家的GDP的一元数据。我想知道如何合并数据集,以便每个二元组具有国家1的GDP和国家2的GDP。
两个数据集都根据3个字符的同位素进行编码。第一个二元数据集具有以下颜色:Country1,country2,flow1,flow2,distance
第二个monadic数据集有国家和GDP。
我想添加GDP数据,以便新数据集现在为: Country1,country2,flow1,flow2,distance,gdp1,gdp2。
有谁知道我如何在R中合并这些集?
提前致谢=)
答案 0 :(得分:1)
如果您想要特定答案,则应发布可复制的数据样本。这应该适用于有向和无向的二元组。假设您的国家/地区ddadic df代码为ccode1
和ccode2
,您的dfs分别命名为dy.df
和mon.df
。
new.df <- merge(dy.df, mon.df, by = c('ccode1', 'year'), all.x = TRUE)
new.df <- merge(dy.df, mon.df, by = c('ccode2', 'year'), all.x = TRUE)
然后你可以从那里清理你的数据集。你还确定你有ISO代码吗?大多数COW材料使用COW代码,而不是ISO代码。我还建议你阅读merge
命令的文档。 help(merge)
。