如何删除行的完全重复项。所以如果我有一个看起来像这样的数据框:
A B C
1 2 3
3 2 2
1 2 3
现在我的数据框比这个要大很多,但是我们可以让python查看每一行,如果行中的值与另一行完全相同,只需删除或删除该行。我想考虑整个数据框,我不想指定我想获得唯一值的列。
答案 0 :(得分:3)
您可以使用DataFrame.drop_duplicates()方法:
In [23]: df
Out[23]:
A B C
0 1 2 3
1 3 2 2
2 1 2 3
In [24]: df.drop_duplicates()
Out[24]:
A B C
0 1 2 3
1 3 2 2
答案 1 :(得分:2)
您可以使用.duplicated
的倒数来获得重复数据删除的数据框:
df[~df.duplicated(['A','B','C'])]
返回:
>>> df[~df.duplicated(['A','B','C'])]
A B C
0 1 2 3
1 3 2 2