我只是好奇大熊猫有更简单的方法来保留重复的行吗?
请不要理解我错了。我有这样的问题,因为我无意中得到了Pandas Dataframe错误并且必须使用重复的行manuelly。
谢谢大家!
答案 0 :(得分:1)
Pandas为DataFrame类提供了一个.duplicated()方法,允许您查找重复的列。
>>> df = DataFrame([[1,2,3],[3,4,6],[1,2,3],[1,2,3]],columns=['T1','T2','T3'])
>>> df
T1 T2 T3
0 1 2 3
1 3 4 6
2 1 2 3
3 1 2 2
>>> df[df.duplicated(keep=False)]
T1 T2 T3
0 1 2 3
2 1 2 3
您还可以使用subset参数在某些列中查找重复项。
>>> df[df.duplicated(keep=False,subset='T1')]
T1 T2 T3
0 1 2 3
2 1 2 3
3 1 2 2