Question

我有一个名为＆＃39; model_data＆＃39;的数据集，其中观察单位是取自UCDP PRIO-GRID数据的地理单元格（ gid ）。这只是一个标准化的空间网格结构，允许在非常本地级别进行细粒度分析。我正在研究内战中行为者之间权力平衡对平民使用暴力的影响，即如果行动者表现良好（在任何一个 gid 中实施大部分战斗死亡），他们的目标是或多或少的平民在同一个 gid 。为此，我使用inner_join（通过 gid ）将我的数据集与包含所有武装暴力事件（UCDP Georeferenced Events Dataset）的数据集合并。

合并时，结果数据集包含来自GED数据集的每个暴力事件的重复 gid 观察。我需要找到一种方法来汇总所有平民死亡，所有side_a死亡，以及每个特定 gid 中的所有side_b死亡，以便数据集中的每个观察都是唯一的 gid 包含来自 gid 的各类死亡的所有数据。

    model_data <- inner_join(grid, ged, by = c("year", "gid" = "priogrid_gid", "xcoord" = "longitude", "ycoord" = "latitude"))

从第一列可以看出，有多个观察结果使用相同的 gid 。我想将观察中的所有数据与相同的 gid 汇总到一个观察中。

我已经研究了很多关于如何做到这一点的最佳方法，但迄今为止一直没有成功。从我收集的内容来看，＆＃34; sp＆＃34;中的aggregate（）函数包装将是我最好的选择，但我无法解决如何以我需要的方式使用它！感谢您提供的任何帮助

Answer 1

这个怎么样？

library(dplyr)

model_data %>%
    select(-id) %>%
    distinct()

假设只使用＆＃34; gid＆＃34;没有＆＃34; id＆＃34;会让你到达你想去的地方。

如何将计数数据汇总到特定的地理位置

1 个答案: