我尝试合并R中的两个数据集。我通常使用dplyr
合并两个基于国家/年的数据集。但在这种情况下:
dataset1
是country-year
:
dataset2
是基于事件的:想象一下像恐怖袭击这样的事情。这些事件每年都不会发生。在某些年份,有不止一个事件。
理想的结果:将dataset2
整合到country-year
格式中,并计算当年的事件总数。这将如何运作?
答案 0 :(得分:0)
假设dataset2
中的每一行都代表一个事件,那么这应该符合您的要求:
library(dplyr)
dataset2 %>%
group_by(location, year) %>%
summarize(n_events = n()) %>%
left_join(dataset1, ., by = c("cname" = "location", "year" = "year"))