生成饼图子图以在groupby中获得独特的结果?

时间:2018-12-12 18:50:35

标签: python matplotlib pie-chart

为数据框中的唯一值生成饼图的最佳方法是什么?

我有一个DataFrame,可以按县显示服务数量。我想为每个县制作一组饼图,以显示该县的服务数量。我尝试了各种不同的方法,但收效甚微。

这是我的数据

print(mdfgroup)

    County     Service    ServiceCt
0   Alamance    Literacy          1
1   Alamance   Technical          1
2   Alamance  Vocational          4
3    Chatham    Literacy          3
4    Chatham   Technical          2
5    Chatham  Vocational          1
6     Durham    Literacy          1
7     Durham   Technical          1
8     Durham  Vocational          1
9     Orange    Literacy          1
10      Wake    Literacy          2
11      Wake   Technical          2

因此,Alamance将有一张图表,其中包含扫盲,技术和职业方面的图表; Chatham,Durham等的图表。切片大小将基于ServiceCt。

我一直在尝试许多不同的方法,但是我不确定最有效的方法是什么。我尝试过,但在下面它并没有真正按县分类,也没有得到任何图形。

for i, row in enumerate(mdfgroup.itertuples(),1):
       plt.figure()
       plt.pie(row.ServiceCt,labels=row.Service,
       startangle=90,frame=True, explode=0.2,radius=3)
plt.show()

这会引发错误:

TypeError: len() of unsized object

然后生成一个空白的绘图框

(我还不能嵌入图像,所以这里是链接) Blank Plot Box

理想情况下,我希望它们全部为子图,但是在此阶段,我将进行一系列单独的绘制。我发现的其他示例未处理键(县)的唯一值。

2 个答案:

答案 0 :(得分:1)

这是您的主意吗?

Ncounties = len(mdfgroup.County.unique())
fig, axs = plt.subplots(1, Ncounties, figsize=(3*Ncounties,3), subplot_kw={'aspect':'equal'})
for ax,(groupname,subdf) in zip(axs,mdfgroup.groupby('County')):
    ax.pie(subdf.ServiceCt, labels=subdf.Service)
    ax.set_title(groupname)

enter image description here

答案 1 :(得分:0)

使用matplotlib

一种常见的方法是遍历列的groupby。这里要迭代的列是"Country"。您可以首先创建一个子图网格,其中至少包含与唯一国家/地区相同数量的子图。然后,您可以同时遍历子图和组。
最后,可能会有一些空的子图。可以将它们设置为不可见。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

df = pd.DataFrame({"Country" : list("AAACCCDDDOWW"),
                   "Service" : list("LTV")*4,
                   "ServiceCt" : list(map(int, "114321111122"))})

cols = 3
g = df.groupby("Country")
rows = int(np.ceil(len(g)/cols))

fig, axes = plt.subplots(ncols=cols, nrows=rows)

for (c, grp), ax in zip(g, axes.flat):
    ax.pie(grp.ServiceCt, labels=grp.Service)
    ax.set_title(c)

if len(g) < cols*rows:    
    for ax in axes.flatten()[len(g):]:
        ax.axis("off")

plt.show()

enter image description here

使用seaborn

此案例实际上非常适合与seaborn的FacetGrid一起使用。

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame({"Country" : list("AAACCCDDDOWW"),
                   "Service" : list("LTV")*4,
                   "ServiceCt" : list(map(int, "114321111122"))})

def pie(v, l, color=None):
    plt.pie(v, labels=l.values)
g = sns.FacetGrid(df, col="Country")
g.map(pie, "ServiceCt", "Service" )

plt.show()

enter image description here

使用熊猫

最后,一个人可以使用熊猫在同一行中完成所有工作。

import pandas as pd
import matplotlib.pyplot as plt

df = pd.DataFrame({"Country" : list("AAACCCDDDOWW"),
                   "Service" : list("LTV")*4,
                   "ServiceCt" : list(map(int, "114321111122"))})


df.pivot("Service", "Country", "ServiceCt").plot.pie(subplots=True, legend=False)

plt.show()

enter image description here