使用R索引和计数变量的唯一组合,但不要删除重复项

时间:2017-09-22 02:04:43

标签: r duplicates data.table unique

以此数据框为例:

DT <- data.table(A = rep(1:3, each=4), 
                 B = rep(c(NA,1,2,4), each=3), 
                 C = rep(1:2, 6))

我想附加一个列,为A和B的唯一组合分配索引,但忽略C.我还想要另一个列计算重复数的列,如下所示:

    A  B C Index Count
 1: 1 NA 1     1     3
 2: 1 NA 2     1     3
 3: 1 NA 1     1     3
 4: 1  1 2     2     1
 5: 2  1 1     3     2
 6: 2  1 2     3     2
 7: 2  2 1     4     2
 8: 2  2 2     4     2
 9: 3  2 1     5     1
10: 3  4 2     6     3
11: 3  4 1     6     3
12: 3  4 2     6     3

我不想修剪数据框和(最好)我不想重新排序行。 我尝试过setDT,比如

setDT(DT)[,.(.I, .N), by = names(DT[,1:2])]

但是I列不是我想要的索引,而C列已经消失了。 提前谢谢!

0 个答案:

没有答案