我一直在尝试通过使用以下代码突出显示df中的重复值。
composer update
尽管它正确地标记了重复项,但也将空白值标记为重复项。
请提出一些建议,以便忽略空白值。
答案 0 :(得分:2)
如果空白缺少值,则用&
用Series.notna
逐位AND
测试非错误值的链掩码:
ncns['D-Account'] = ncns.duplicated('Account Number') & ncns['Account Number'].notna()
如果空格为空字符串,则将非''
与Series.ne
进行比较:
ncns['D-Account'] = ncns.duplicated('Account Number') & ncns['Account Number'].ne('')