在我的项目中,我有一个包含两列字符串值的电子表格,如下所示:
1 | A | B | 2 |Blagh | Nagh | 3 |Ipsum | Lorem| 4 |Nagh | Blagh| 5 |Lorem | Fluff|
如果按顺序排列,每行都是唯一的,但是其排列也不是唯一的(例如,A2B2 = B4A4,依此类推)。
在这个项目中,位置无关紧要。
使用电子表格程序如何删除这些“排列重复项”?
(当前使用LibreOffice Calc,但如果在任何此类软件中无法使用,则可以接受有关使用DataFrame库(如Pandas)的建议。)
答案 0 :(得分:1)
我会再试一次。
对ColumnA进行排序,然后对ColumnB进行排序(如果需要保留顺序,请首先添加一个索引列,然后对它进行排序)。
在C1中并向下复制以适合:
=ROW()<>IF(INDEX(B:B,MATCH(B1,A:A,0))=A1,MAX(ROW(),MATCH(B1,A:A,0)))
对ColumnC进行过滤以删除显示FALSE
的单元格。