根据另一列中的另一个值删除一列中的重复值

时间:2019-09-26 04:47:32

标签: python dataframe merge duplicates

我有类似下面的数据

label,post_id
car,post_a
dog,post_a
car,post_a
dog,post_a
tree,post_a
car,post_b
dog,post_b
dog,post_b
chicken,post_b
chicken,post_b

我希望他们像下面一样

label,post_id
car,post_a
dog,post_a
tree,post_a
car,post_b
dog,post_b
chicken,post_b

由于我有数百万行这样的数据,因此现在我已经为这个问题编写了一个具有多处理功能的函数,但是我确定有一些Python方式可以处理这样的问题?例如pd.merge()df.drop_duplicates()来删除重复的值。有人可以帮我吗?

0 个答案:

没有答案
相关问题