Question

我一直在尝试通过使用以下代码突出显示df中的重复值。

composer update

尽管它正确地标记了重复项，但也将空白值标记为重复项。

请提出一些建议，以便忽略空白值。

Answer 1

如果空白缺少值，则用&用Series.notna逐位AND测试非错误值的链掩码：

ncns['D-Account'] = ncns.duplicated('Account Number') & ncns['Account Number'].notna()

如果空格为空字符串，则将非''与Series.ne进行比较：

ncns['D-Account'] = ncns.duplicated('Account Number') & ncns['Account Number'].ne('')