多列,多行条件重复删除

时间:2018-05-09 20:33:48

标签: excel

这是我在Excel中的示例数据集:

query   subject %identity   %RNA_identity   alignment_length    q.start q.end   s.start s.end
FN434113.1  CP001144.1  99.034  96.062  621 43828   44448   292720  293340
FN666575.1  CP001144.1  99.034  96.062  621 43828   44448   292720  293340
CP001144.1  FN434113.1  99.034  96.062  621 292720  293340  43828   44448
CP001144.1  FN666575.1  99.034  96.062  621 292720  293340  43828   44448
CP000352.1  CP001069.1  100 96.166  1289    33919   35207   63625   64913
CP001069.1  CP000352.1  100 96.166  1289    63625   64913   33919   35207

第2行和第4行与colA和colB翻转相同。

第3行和第5行与colA和colB翻转相同。

第6行和第7行与colA和colB翻转相同。

我打算得到的是:

FN434113.1  CP001144.1  99.034  96.062  621 43828   44448   292720  293340
FN666575.1  CP001144.1  99.034  96.062  621 43828   44448   292720  293340
CP000352.1  CP001069.1  100 96.166  1289    33919   35207   63625   64913

这样做的最佳方法是什么?

根据提供的解决方案,我上传文件: https://drive.google.com/file/d/1suihUvfkyGZLnBLQiWlxzHRPo5TEnooN/view?usp=sharing

1 个答案:

答案 0 :(得分:0)

有几种方法可以达到这个目的,但是以下公式

=IF(COUNTIF($C$2:C2,C2)>1, "Here I am! I'm a duplicate!","Original") 

在这里遇到了类似的问题:

https://www.techrepublic.com/blog/microsoft-office/use-formulas-to-find-multi-column-duplicates-in-excel/

我导入了您的数据并将其映射到数据的单元格,并对逻辑进行了改进,使其对2列的顺序不敏感。似乎可以很好地处理您的数据:

=IF(AND(COUNTIF($A$2:B4,B4)>1, COUNTIF($A$2:B4,A4)>1), "Here I am! I'm a duplicate!","Original")

请注意,由于标题,起始行为2。 4(即B4)只是我从中复制公式的任意示例行。 enter image description here