嘿伙计们我之前确实解决了这个问题但是我丢失了我的代码...... 这是对我所拥有的简化。
a1 <- c(1,2,4,3,5)
a2 <- c("a","b","b","c","f")
a3 <- c(3,4,"b",1,9)
a4 <- c("c","b",2,"a","d")
a <- cbind(a1,a2,a3,a4)
a1
和a2
是一个集合,a3
和a4
:
我想删除重复项。因此删除第3行和第4行。这些数据来自显示基因组之间链接的爆炸,它长达34,000行,因此有效的解决方案将非常棒。
非常感谢你!我也愿意用另一种语言来做这件事。
答案 0 :(得分:0)
我们可以sort
&#39; a&#39;按行,获取非{(1}})!
元素的逻辑索引,并使用它来过滤行。
duplicated
数据集中保留的行索引是
i1 <- !duplicated(t(apply(a, 1, sort)))
a1 <- a[i1,]