这是我想要实现的一个例子。请考虑以下data.table
-
library(data.table)
x <- data.table(
Org = c('BNE', 'SIN', 'ADL', 'SIN', 'SYD', 'MEL', 'BNE'),
Dest = c('ADL', 'MEL', 'SYD', 'BNE', 'ADL', 'SIN', 'ADL')
)
> x
Org Dest
1: BNE ADL
2: SIN MEL
3: ADL SYD
4: SIN BNE
5: SYD ADL
6: MEL SIN
7: BNE ADL
我想到达下表 -
Org Dest
1: BNE ADL
2: SIN MEL
3: ADL SYD
4: SIN BNE
在x
中,对于我的用例,第1行和第7行,第2行和第6行以及第3行和第5行是重复的。即重复删除列中列的顺序无关紧要,MEL-SIN与SIN-MEL相同。
有一个类似的问题here,但是这些问题考虑了使apply
函数的使用成为可能的矩阵,这可能不经济,因为我有一个很大的data.table
〜 35M行。
从x
到最低data.table
的最快方式是什么?