我有一个如下数据框:
Districtname pincode
0 central delhi 110001
1 central delhi 110002
2 central delhi 110003
3 central delhi 110004
4 central delhi 110005
如何基于DistrictName列删除行并选择第一个唯一值
我想要的输出:
Districtname pincode
0 central delhi 110001
答案 0 :(得分:5)
pandas.DataFrame.drop_duplicates()
丢弃数据帧,默认情况下保留第一次出现。就您而言,DataFrame.drop_duplicates(subset = "Districtname")
应该可以工作。如果您想更新相同的DataFrame DataFrame.drop_duplicates(subset = "Districtname", inplace = True)
可能会有所帮助。进一步了解click here。
答案 1 :(得分:1)
将drop_duplicates
与inplace=true
一起使用:
df.drop_duplicates('Districtname',inplace=True)