查看Pandas中的重复行

时间:2014-10-06 21:06:27

标签: python pandas

我知道如果我在Pandas中有一个DataFrame对象,我可以通过在DataFrame上使用.duplicated()方法找出该行是否重复。这将返回一个系列给出真或假,取决于该行是否重复。我的问题是,是否可以使用此对象索引原始DataFrame,这样我只返回重复项(以便我可以直观地检查它们)?

1 个答案:

答案 0 :(得分:1)

In [18]: df = pd.DataFrame(np.random.randint(0, 2, (10, 4)))

In [19]: df
Out[19]: 
   0  1  2  3
0  0  1  1  0
1  0  1  1  1
2  0  1  1  1
3  1  1  0  0
4  0  1  0  1
5  1  0  1  0
6  0  1  0  1
7  1  1  1  0
8  0  1  1  0
9  0  0  0  1

[10 rows x 4 columns]

In [20]: df[df.duplicated()]
Out[20]: 
   0  1  2  3
2  0  1  1  1
6  0  1  0  1
8  0  1  1  0

[3 rows x 4 columns]