如何在熊猫数据框中查找重复项并打印它们

时间:2020-01-06 20:07:21

标签: python pandas

我正在使用duplicated函数检查panadas数据帧中是否存在重复的行,效果很好。但是,如何只打印出真实项目的行内容?

例如,如果我运行:

duplicateCheck = dataSet.duplicated(subset=['Name', 'Date',], keep=False)
print(duplicateCheck)

它输出:

0    False
1    False
2    False
3    False
4     True
5     True
6    False
7    False
8    False
9    False

我正在寻找类似的东西

for row in duplicateCheck.keys():
    if row == True:
        print (row, duplicateCheck[row]) 

从数据框中打印出重复的项目。

1 个答案:

答案 0 :(得分:5)

为什么不

duplicateCheck = dataSet.duplicated(subset=['Name', 'Date',], keep=False)

print(dataSet[duplicateCheck])