Question

只需学习熊猫，那么任何帮助都会很棒。我有一个数据框，其中包含谷物名称，制造商及其等级的名称。我想弄清楚有多少谷物的评级高于50，并确定有多少谷物属于每个制造商

这是我尝试的：

df_3['HighRate'] = 'No' 
df_3['HighRate'][df['rating'] > 50 = 'Yes' 
dfGrouped2 = df_3.groupby(['manufacturer','HighRate'])

 dfGrouped2

和

HighRate = df_3[df_3[['rating'] > 50]
dfGrouped2 = df_3.groupby(['manufacturer','HighRate'])
dfGrouped2




name    manufacturer    rating
Cheerios    G           50.764999
Wheaties    C           51.592193

Answer 1

您可以尝试

df_high = df[df['rating'] > 50]
df_high.groupby('manufacturer')['manufacturer'].agg(['count'])

这将提供谷物评级高于50的制造商数量。

在熊猫数据框中，使用分组来查找每个制造商属于多少具有一定价值的物品

1 个答案: