是否有更好的方法来保留Pandas中的重复行?

时间:2016-06-17 22:15:46

标签: python pandas

我只是好奇大熊猫有更简单的方法来保留重复的行吗?

请不要理解我错了。我有这样的问题,因为我无意中得到了Pandas Dataframe错误并且必须使用重复的行manuelly。

谢谢大家!

1 个答案:

答案 0 :(得分:1)

Pandas为DataFrame类提供了一个.duplicated()方法,允许您查找重复的列。

>>> df = DataFrame([[1,2,3],[3,4,6],[1,2,3],[1,2,3]],columns=['T1','T2','T3'])

>>> df
    T1  T2  T3
0   1   2   3
1   3   4   6
2   1   2   3
3   1   2   2

>>> df[df.duplicated(keep=False)]
    T1  T2  T3
0   1   2   3
2   1   2   3

您还可以使用subset参数在某些列中查找重复项。

>>> df[df.duplicated(keep=False,subset='T1')]
    T1  T2  T3
0   1   2   3
2   1   2   3
3   1   2   2