在特定列的数据框中删除重复的行

时间:2019-09-02 17:17:46

标签: python python-3.x pandas dataframe

我有一个如下数据框:


    Districtname    pincode
0   central delhi   110001
1   central delhi   110002
2   central delhi   110003
3   central delhi   110004
4   central delhi   110005

如何基于DistrictName列删除行并选择第一个唯一值

我想要的输出:

    Districtname    pincode
0   central delhi   110001

2 个答案:

答案 0 :(得分:5)

可以使用pandas.DataFrame.drop_duplicates()丢弃

数据帧,默认情况下保留第一次出现。就您而言,DataFrame.drop_duplicates(subset = "Districtname")应该可以工作。如果您想更新相同的DataFrame DataFrame.drop_duplicates(subset = "Districtname", inplace = True)可能会有所帮助。进一步了解click here

答案 1 :(得分:1)

drop_duplicatesinplace=true一起使用:

df.drop_duplicates('Districtname',inplace=True)