Question

嘿伙计们我之前确实解决了这个问题但是我丢失了我的代码...... 这是对我所拥有的简化。

a1 <- c(1,2,4,3,5)
a2 <- c("a","b","b","c","f")
a3 <- c(3,4,"b",1,9)
a4 <- c("c","b",2,"a","d")
a <- cbind(a1,a2,a3,a4)

a1和a2是一个集合，a3和a4：

我想删除重复项。因此删除第3行和第4行。这些数据来自显示基因组之间链接的爆炸，它长达34,000行，因此有效的解决方案将非常棒。

非常感谢你！我也愿意用另一种语言来做这件事。

Answer 1

我们可以sort＆＃39; a＆＃39;按行，获取非{（1}}）!元素的逻辑索引，并使用它来过滤行。

duplicated

数据集中保留的行索引是

i1 <- !duplicated(t(apply(a, 1, sort)))
a1 <- a[i1,]