Question

我正在尝试检查重复项。我用df['name_duplicated'] = df.duplicated('name', keep=False) 但是，这会将name = NaN的任何行视为副本。

有谁知道怎么解决这个问题？

我正在尝试df[pd.isnull(df['name'])]['name_duplicated'] = False，但我收到了错误。

Answer 1

你可以尝试检查NaN并对重复调用的结果进行布尔和操作

df['name_duplicated'] = df.duplicated('name', keep=False) & df['name'].notnull()