让数据框包含两列(A
和B
)中的重复值:
A B
1 2
2 3
4 5
7 6
5 8
我想删除重复项,以便只保留唯一值:
A B
1 2
4 5
7 6
此命令未提供我想要的内容:
df.drop_duplicates(subset=['A','B'], keep='first')
知道怎么做吗?
答案 0 :(得分:2)
print (df.stack().drop_duplicates().unstack().dropna().astype(int))
A B
0 1 2
2 4 5
3 7 6
boolean indexing
的解决方案:
print (df[~df.stack().duplicated().unstack().any(1)])
A B
0 1 2
2 4 5
3 7 6