只需学习熊猫,那么任何帮助都会很棒。我有一个数据框,其中包含谷物名称,制造商及其等级的名称。我想弄清楚有多少谷物的评级高于50,并确定有多少谷物属于每个制造商
这是我尝试的:
df_3['HighRate'] = 'No'
df_3['HighRate'][df['rating'] > 50 = 'Yes'
dfGrouped2 = df_3.groupby(['manufacturer','HighRate'])
dfGrouped2
和
HighRate = df_3[df_3[['rating'] > 50]
dfGrouped2 = df_3.groupby(['manufacturer','HighRate'])
dfGrouped2
name manufacturer rating
Cheerios G 50.764999
Wheaties C 51.592193
答案 0 :(得分:0)
您可以尝试
df_high = df[df['rating'] > 50]
df_high.groupby('manufacturer')['manufacturer'].agg(['count'])
这将提供谷物评级高于50的制造商数量。