根据与订单无关的列组合获取唯一行 - data.table

时间:2017-12-03 23:21:02

标签: r data.table

这是我想要实现的一个例子。请考虑以下data.table -

library(data.table)
x <- data.table(
  Org = c('BNE', 'SIN', 'ADL', 'SIN', 'SYD', 'MEL', 'BNE'), 
  Dest = c('ADL', 'MEL', 'SYD', 'BNE', 'ADL', 'SIN', 'ADL')
)
> x
   Org Dest
1: BNE  ADL
2: SIN  MEL
3: ADL  SYD
4: SIN  BNE
5: SYD  ADL
6: MEL  SIN
7: BNE  ADL

我想到达下表 -

   Org Dest
1: BNE  ADL
2: SIN  MEL
3: ADL  SYD
4: SIN  BNE

x中,对于我的用例,第1行和第7行,第2行和第6行以及第3行和第5行是重复的。即重复删除列中列的顺序无关紧要,MEL-SIN与SIN-MEL相同。

有一个类似的问题here,但是这些问题考虑了使apply函数的使用成为可能的矩阵,这可能不经济,因为我有一个很大的data.table〜 35M行。

x到最低data.table的最快方式是什么?

0 个答案:

没有答案