我正在使用duplicated
函数检查panadas数据帧中是否存在重复的行,效果很好。但是,如何只打印出真实项目的行内容?
例如,如果我运行:
duplicateCheck = dataSet.duplicated(subset=['Name', 'Date',], keep=False)
print(duplicateCheck)
它输出:
0 False
1 False
2 False
3 False
4 True
5 True
6 False
7 False
8 False
9 False
我正在寻找类似的东西
for row in duplicateCheck.keys():
if row == True:
print (row, duplicateCheck[row])
从数据框中打印出重复的项目。
答案 0 :(得分:5)
为什么不
duplicateCheck = dataSet.duplicated(subset=['Name', 'Date',], keep=False)
print(dataSet[duplicateCheck])