我想检查一个数据框是否连续有多个重复值。例如,对于此数据集,我想检查重复'STUDY_ID'
和'VISITCODE'
的条目数。我尝试像这样实现它但是语法错误,我不知道为什么。
bp[(bp.duplicated('STUDY_ID') == True) && (bp.duplicated('VISITCODE') == True)]
是否有可能以这种方式实现我想要的东西?如果是这样,那会是更好的方法吗?
答案 0 :(得分:2)
您可以将&&
更改为&
bitwise and
并忽略== True
:
bp[(bp.duplicated('STUDY_ID') & bp.duplicated('VISITCODE')]
用于检查多列中的重复项:
bp[bp.duplicated(['STUDY_ID', 'VISITCODE'])]