seaborn barplot中的酒吧升序

时间:2018-02-21 16:14:57

标签: python pandas matplotlib bar-chart seaborn

我有以下数据框

   Class    Age Percentage
0   2004    3   43.491170
1   2004    2   29.616607
2   2004    4   13.838925
3   2004    6   10.049712
4   2004    5   2.637445
5   2004    1   0.366142
6   2005    2   51.267369
7   2005    3   19.589268
8   2005    6   13.730432
9   2005    4   11.155305
10  2005    5   3.343524
11  2005    1   0.913590
12  2005    9   0.000511

我想使用seaborn制作条形图,其中y轴是'百分比',x轴是'类',并使用'年龄'列标记它们。我还想按降序排列条形,即从较大的条形到较小的条形。

为了做到这一点,我想到了以下内容:我将根据'Percentage'变量的顺序更改hue_order参数。例如,如果我按Class == 2004的降序对“百分比”列进行排序,则为hue_order = [3, 2, 4, 6, 5, 1]

这是我的代码:

import matplotlib.pyplot as plt
import seaborn as sns

def hue_order():
    for cls in dataset.Class.unique():
        temp_df = dataset[dataset['Class'] == cls]
        order = temp_df.sort_values('Percentage', ascending = False)['Age']  
    return order

sns.barplot(x="Class", y="Percentage", hue = 'Age', 
                 hue_order= hue_order(),  
                 data=dataset)
plt.show()

但是,条形仅按Class == 2005的降序排列。有什么帮助吗?

在我的问题中,我使用的是hue参数,因此,它不像提议的那样重复。

Result

1 个答案:

答案 0 :(得分:1)

seaborn hue参数为绘图添加了另一个维度。 hue_order确定此维度的处理顺序。但是你无法拆分该订单。这意味着您可以更改顺序,使Age == 2位于图中的第三位。但是你不能部分地改变它,这样在某些方面它是在第一个,在另一些方面它将在第三位。

为了实现此处所需,即在同一轴内使用不同的辅助尺寸顺序,您需要手动处理。

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

df = pd.DataFrame({"Class" : [2004]*6+[2005]*7,
                   "Age" : [3,2,4,6,5,1,2,3,6,4,5,1,9],
                   "Percentage" : [50,40,30,20,10,30,20,35,40,50,45,30,15]})

def sortedgroupedbar(ax, x,y, groupby, data=None, width=0.8, **kwargs):
    order = np.zeros(len(data))
    df = data.copy()
    for xi in np.unique(df[x].values):
        group = data[df[x] == xi]
        a = group[y].values
        b = sorted(np.arange(len(a)),key=lambda x:a[x],reverse=True)
        c = sorted(np.arange(len(a)),key=lambda x:b[x])
        order[data[x] == xi] = c   
    df["order"] = order
    u, df["ind"] = np.unique(df[x].values, return_inverse=True)
    step = width/len(np.unique(df[groupby].values))
    for xi,grp in df.groupby(groupby):
        ax.bar(grp["ind"]-width/2.+grp["order"]*step+step/2.,
               grp[y],width=step, label=xi, **kwargs)
    ax.legend(title=groupby)
    ax.set_xticks(np.arange(len(u)))
    ax.set_xticklabels(u)
    ax.set_xlabel(x)
    ax.set_ylabel(y)


fig, ax = plt.subplots()    
sortedgroupedbar(ax, x="Class",y="Percentage", groupby="Age", data=df)
plt.show()

docs