检查数据框中一行中多个列的重复值。

时间:2018-02-14 12:40:05

标签: python pandas dataframe

我想检查一个数据框是否连续有多个重复值。例如,对于此数据集,我想检查重复'STUDY_ID''VISITCODE'的条目数。我尝试像这样实现它但是语法错误,我不知道为什么。

bp[(bp.duplicated('STUDY_ID') == True) && (bp.duplicated('VISITCODE') == True)]

是否有可能以这种方式实现我想要的东西?如果是这样,那会是更好的方法吗?

1 个答案:

答案 0 :(得分:2)

您可以将&&更改为& bitwise and并忽略== True

bp[(bp.duplicated('STUDY_ID') & bp.duplicated('VISITCODE')]

用于检查多列中的重复项:

bp[bp.duplicated(['STUDY_ID', 'VISITCODE'])]