应用错误收集

这是我想要实现的一个例子。请考虑以下data.table -

library(data.table)
x <- data.table(
  Org = c('BNE', 'SIN', 'ADL', 'SIN', 'SYD', 'MEL', 'BNE'), 
  Dest = c('ADL', 'MEL', 'SYD', 'BNE', 'ADL', 'SIN', 'ADL')
)
> x
   Org Dest
1: BNE  ADL
2: SIN  MEL
3: ADL  SYD
4: SIN  BNE
5: SYD  ADL
6: MEL  SIN
7: BNE  ADL

我想到达下表 -

   Org Dest
1: BNE  ADL
2: SIN  MEL
3: ADL  SYD
4: SIN  BNE

在x中，对于我的用例，第1行和第7行，第2行和第6行以及第3行和第5行是重复的。即重复删除列中列的顺序无关紧要，MEL-SIN与SIN-MEL相同。

有一个类似的问题here，但是这些问题考虑了使apply函数的使用成为可能的矩阵，这可能不经济，因为我有一个很大的data.table〜 35M行。

从x到最低data.table的最快方式是什么？

根据与订单无关的列组合获取唯一行 - data.table

0 个答案: