应用错误收集

以此数据框为例：

DT <- data.table(A = rep(1:3, each=4), 
                 B = rep(c(NA,1,2,4), each=3), 
                 C = rep(1:2, 6))

我想附加一个列，为A和B的唯一组合分配索引，但忽略C.我还想要另一个列计算重复数的列，如下所示：

    A  B C Index Count
 1: 1 NA 1     1     3
 2: 1 NA 2     1     3
 3: 1 NA 1     1     3
 4: 1  1 2     2     1
 5: 2  1 1     3     2
 6: 2  1 2     3     2
 7: 2  2 1     4     2
 8: 2  2 2     4     2
 9: 3  2 1     5     1
10: 3  4 2     6     3
11: 3  4 1     6     3
12: 3  4 2     6     3

我不想修剪数据框和（最好）我不想重新排序行。我尝试过setDT，比如

setDT(DT)[,.(.I, .N), by = names(DT[,1:2])]

但是I列不是我想要的索引，而C列已经消失了。提前谢谢！

使用R索引和计数变量的唯一组合，但不要删除重复项

0 个答案: