我有一个数据框,只想计算每个组中的元素数量。我知道,我可以使用groupby()。count()来获取所有列的所有计数,但对我来说太多了,我只想要每组中的元素数量。我怎么能这样做?
以下是示例:
mydf = pd.DataFrame({"fruit":["apple","banana","apple"],"weight":[7,8,3],"price":[4,5,6]})
mydf
>> fruit price weight
>> 0 apple 4 7
>> 1 banana 5 8
>> 2 apple 6 3
如果我使用groupby(" fruit")。mean(),我将得到每列的值。
mydf.groupby("fruit").mean()
>> price weight
>> fruit
>> apple 2 2
>> banana 1 1
但我的期望输出是:
>> number_of_fruit
>> fruit
>> apple 2
>> banana 1
我该怎么做?
答案 0 :(得分:4)
您希望size
计算每个水果的数量:
In [102]:
mydf.groupby('fruit').size()
Out[102]:
fruit
apple 2
banana 1
dtype: int64