我有一个名为' model_data'的数据集,其中观察单位是取自UCDP PRIO-GRID数据的地理单元格( gid )。这只是一个标准化的空间网格结构,允许在非常本地级别进行细粒度分析。我正在研究内战中行为者之间权力平衡对平民使用暴力的影响,即如果行动者表现良好(在任何一个 gid 中实施大部分战斗死亡),他们的目标是或多或少的平民在同一个 gid 。为此,我使用inner_join(通过 gid )将我的数据集与包含所有武装暴力事件(UCDP Georeferenced Events Dataset)的数据集合并。
合并时,结果数据集包含来自GED数据集的每个暴力事件的重复 gid 观察。我需要找到一种方法来汇总所有平民死亡,所有side_a死亡,以及每个特定 gid 中的所有side_b死亡,以便数据集中的每个观察都是唯一的 gid 包含来自 gid 的各类死亡的所有数据。
model_data <- inner_join(grid, ged, by = c("year", "gid" = "priogrid_gid", "xcoord" = "longitude", "ycoord" = "latitude"))
从第一列可以看出,有多个观察结果使用相同的 gid 。我想将观察中的所有数据与相同的 gid 汇总到一个观察中。
我已经研究了很多关于如何做到这一点的最佳方法,但迄今为止一直没有成功。从我收集的内容来看,&#34; sp&#34;中的aggregate()函数包装将是我最好的选择,但我无法解决如何以我需要的方式使用它!感谢您提供的任何帮助
答案 0 :(得分:0)
这个怎么样?
library(dplyr)
model_data %>%
select(-id) %>%
distinct()
假设只使用&#34; gid&#34;没有&#34; id&#34;会让你到达你想去的地方。