我有类似下面的数据
label,post_id
car,post_a
dog,post_a
car,post_a
dog,post_a
tree,post_a
car,post_b
dog,post_b
dog,post_b
chicken,post_b
chicken,post_b
我希望他们像下面一样
label,post_id
car,post_a
dog,post_a
tree,post_a
car,post_b
dog,post_b
chicken,post_b
由于我有数百万行这样的数据,因此现在我已经为这个问题编写了一个具有多处理功能的函数,但是我确定有一些Python方式可以处理这样的问题?例如pd.merge()
或df.drop_duplicates()
来删除重复的值。有人可以帮我吗?