我正在尝试检查重复项。
我用df['name_duplicated'] = df.duplicated('name', keep=False)
但是,这会将name
= NaN
的任何行视为副本。
有谁知道怎么解决这个问题?
我正在尝试df[pd.isnull(df['name'])]['name_duplicated'] = False
,但我收到了错误。
答案 0 :(得分:1)
你可以尝试检查NaN并对重复调用的结果进行布尔和操作
df['name_duplicated'] = df.duplicated('name', keep=False) & df['name'].notnull()