以此数据框为例:
DT <- data.table(A = rep(1:3, each=4),
B = rep(c(NA,1,2,4), each=3),
C = rep(1:2, 6))
我想附加一个列,为A和B的唯一组合分配索引,但忽略C.我还想要另一个列计算重复数的列,如下所示:
A B C Index Count
1: 1 NA 1 1 3
2: 1 NA 2 1 3
3: 1 NA 1 1 3
4: 1 1 2 2 1
5: 2 1 1 3 2
6: 2 1 2 3 2
7: 2 2 1 4 2
8: 2 2 2 4 2
9: 3 2 1 5 1
10: 3 4 2 6 3
11: 3 4 1 6 3
12: 3 4 2 6 3
我不想修剪数据框和(最好)我不想重新排序行。 我尝试过setDT,比如
setDT(DT)[,.(.I, .N), by = names(DT[,1:2])]
但是I列不是我想要的索引,而C列已经消失了。 提前谢谢!