R删除其他列中的重复项

时间:2016-08-31 19:13:39

标签: r

嘿伙计们我之前确实解决了这个问题但是我丢失了我的代码...... 这是对我所拥有的简化。

a1 <- c(1,2,4,3,5)
a2 <- c("a","b","b","c","f")
a3 <- c(3,4,"b",1,9)
a4 <- c("c","b",2,"a","d")
a <- cbind(a1,a2,a3,a4)

a1a2是一个集合,a3a4

enter image description here

我想删除重复项。因此删除第3行和第4行。这些数据来自显示基因组之间链接的爆炸,它长达34,000行,因此有效的解决方案将非常棒。

非常感谢你!我也愿意用另一种语言来做这件事。

1 个答案:

答案 0 :(得分:0)

我们可以sort&#39; a&#39;按行,获取非{(1}})!元素的逻辑索引,并使用它来过滤行。

duplicated

数据集中保留的行索引是

i1 <- !duplicated(t(apply(a, 1, sort)))
a1 <- a[i1,]