标签: python pandas dataframe
我的问题是我的数据不能很好地表示实际情况,因为它有很多重复的行。请考虑以下内容 -
a b 1 23 42 2 23 42 3 23 42 4 14 12 5 14 12
我只需要1行并消除所有重复项。它完成后应该如下所示。
a b 1 23 42 2 14 12
是否有这样做的功能?
答案 0 :(得分:7)
我们将drop_duplicates与keep='first':
drop_duplicates
keep='first'
df2.drop_duplicates(keep='first')
输出:
a b 1 23 42 4 14 12