在忽略熊猫中的空值的同时标记重复项

时间:2020-03-18 05:30:13

标签: python pandas

我一直在尝试通过使用以下代码突出显示df中的重复值。

composer update

尽管它正确地标记了重复项,但也将空白值标记为重复项。

请提出一些建议,以便忽略空白值。

1 个答案:

答案 0 :(得分:2)

如果空白缺少值,则用&Series.notna逐位AND测试非错误值的链掩码:

ncns['D-Account'] = ncns.duplicated('Account Number') & ncns['Account Number'].notna()

如果空格为空字符串,则将非''Series.ne进行比较:

ncns['D-Account'] = ncns.duplicated('Account Number') & ncns['Account Number'].ne('')