我正在使用python和pandas进行项目数据分析,其中包含以下数据:
数字就是计数。
USA: 5000
Canada: 7000
UK: 6000
France: 6500
Spain: 4000
Japan: 5
China: 7
Hong Kong: 10
Taiwan: 6
New Zealand: 8
South Africa: 11
我的任务是制作一个代表计数的饼图。
df['Country'].value_counts().plot.pie()
我将得到一个饼图,但我想将数量较少的国家合并起来,并像其他国家一样归类。
我该怎么做?
答案 0 :(得分:1)
IIUC使用np.where
设置边界,然后groupby
+ sum
,请注意这里我正在使用pandas.Series.groupby
s=df['Country'].value_counts()
s.groupby(np.where(s>=4000,s.index,'other')).sum()#.plot.pie()
Out[64]:
Canada 7000
France 6500
Spain 4000
UK 6000
USA 5000
other 47