Question

我只是好奇大熊猫有更简单的方法来保留重复的行吗？

请不要理解我错了。我有这样的问题，因为我无意中得到了Pandas Dataframe错误并且必须使用重复的行manuelly。

谢谢大家！

Answer 1

Pandas为DataFrame类提供了一个.duplicated（）方法，允许您查找重复的列。

>>> df = DataFrame([[1,2,3],[3,4,6],[1,2,3],[1,2,3]],columns=['T1','T2','T3'])

>>> df
    T1  T2  T3
0   1   2   3
1   3   4   6
2   1   2   3
3   1   2   2

>>> df[df.duplicated(keep=False)]
    T1  T2  T3
0   1   2   3
2   1   2   3

您还可以使用subset参数在某些列中查找重复项。

>>> df[df.duplicated(keep=False,subset='T1')]
    T1  T2  T3
0   1   2   3
2   1   2   3
3   1   2   2

是否有更好的方法来保留Pandas中的重复行？

1 个答案: