Question

我喜欢这样的数据框X：

ID   Category
1      green
1      green
2      orange
2      orange
3      yellow
3      yellow
3      yellow
8      green
8      green
8      green

并且我正在尝试获取像这样的数据框Category：

ID   Category
1      green
2      orange
3      yellow
8      green

我尝试过使用groupby函数，但是没有得到预期的结果：

Category = X.groupby(['ID'],as_index=False)['Category']

我猜该解决方案很简单，但是我没有找到解决方案，因为它是一个字符串。谢谢

Answer 1

请您尝试以下。

df.drop_duplicates(subset='ID', keep='first')

输出如下。

   ID     Category
0  1       green 
2  2       orange 
4  3       yellow 
7  8       green