我喜欢这样的数据框X
:
ID Category
1 green
1 green
2 orange
2 orange
3 yellow
3 yellow
3 yellow
8 green
8 green
8 green
并且我正在尝试获取像这样的数据框Category
:
ID Category
1 green
2 orange
3 yellow
8 green
我尝试过使用groupby函数,但是没有得到预期的结果:
Category = X.groupby(['ID'],as_index=False)['Category']
我猜该解决方案很简单,但是我没有找到解决方案,因为它是一个字符串。 谢谢
答案 0 :(得分:0)
请您尝试以下。
df.drop_duplicates(subset='ID', keep='first')
输出如下。
ID Category
0 1 green
2 2 orange
4 3 yellow
7 8 green