我有一个大数据框。我需要找到特定列的所有行的总和,但重复项只计算一次。例如,
考虑以下数据框:
z = data.frame(id = c(16249, 16249, 16250, 16251), value = c(1, 1, 2, 3))
id value
1 16249 1
2 16249 1
3 16250 2
4 16251 3
我需要找到“value”列的所有行的总和,但重复的“id”只计算一次。所以,在上面的例子中,答案应该是:1 + 2 + 3 = 6(对应于id 16249,16250和16251)。
谢谢!
答案 0 :(得分:3)
查看?duplicated
:
sum(with(z, value[!duplicated(id)]))