基于多列的唯一值

时间:2017-06-28 17:26:11

标签: python python-3.x pandas dataframe

我有2列包含重复的条目。见下面的例子。 我想从两列中删除重复项 原始列

MatchN  Striker
1000887 DA Warner
1000887 DA Warner
1000887 TM Head
1000887 TM Head

我想最终得到结果

MatchN  Striker
1000887 DA Warner
1000887 TM Head

我尝试使用

np.df[["MatchN"],["Striker"]].unique()

但它不起作用。

有人可以建议找到理想结果的最佳方法吗?

1 个答案:

答案 0 :(得分:4)

IIUC你需要DataFrame.drop_duplicates()方法:

In [69]: df = df.drop_duplicates(['MatchN','Striker'])

In [70]: df
Out[70]:
    MatchN    Striker
0  1000887  DA Warner
2  1000887    TM Head