Question

我有一个如下数据框：


    Districtname    pincode
0   central delhi   110001
1   central delhi   110002
2   central delhi   110003
3   central delhi   110004
4   central delhi   110005

如何基于DistrictName列删除行并选择第一个唯一值

我想要的输出：

    Districtname    pincode
0   central delhi   110001

Answer 1

可以使用pandas.DataFrame.drop_duplicates()丢弃

数据帧，默认情况下保留第一次出现。就您而言，DataFrame.drop_duplicates(subset = "Districtname")应该可以工作。如果您想更新相同的DataFrame DataFrame.drop_duplicates(subset = "Districtname", inplace = True)可能会有所帮助。进一步了解click here。

Answer 2

将drop_duplicates与inplace=true一起使用：

df.drop_duplicates('Districtname',inplace=True)

在特定列的数据框中删除重复的行

2 个答案: