大熊猫重复删除nans

时间:2015-10-29 20:39:26

标签: python python-2.7 pandas duplicates

我正在尝试检查重复项。 我用df['name_duplicated'] = df.duplicated('name', keep=False) 但是,这会将name = NaN的任何行视为副本。

有谁知道怎么解决这个问题?

我正在尝试df[pd.isnull(df['name'])]['name_duplicated'] = False,但我收到了错误。

1 个答案:

答案 0 :(得分:1)

你可以尝试检查NaN并对重复调用的结果进行布尔和操作

df['name_duplicated'] = df.duplicated('name', keep=False) & df['name'].notnull()
相关问题