我有以下数据框
Class Age Percentage
0 2004 3 43.491170
1 2004 2 29.616607
2 2004 4 13.838925
3 2004 6 10.049712
4 2004 5 2.637445
5 2004 1 0.366142
6 2005 2 51.267369
7 2005 3 19.589268
8 2005 6 13.730432
9 2005 4 11.155305
10 2005 5 3.343524
11 2005 1 0.913590
12 2005 9 0.000511
我想使用seaborn制作条形图,其中y轴是'百分比',x轴是'类',并使用'年龄'列标记它们。我还想按降序排列条形,即从较大的条形到较小的条形。
为了做到这一点,我想到了以下内容:我将根据'Percentage'变量的顺序更改hue_order
参数。例如,如果我按Class == 2004
的降序对“百分比”列进行排序,则为hue_order = [3, 2, 4, 6, 5, 1]
。
这是我的代码:
import matplotlib.pyplot as plt
import seaborn as sns
def hue_order():
for cls in dataset.Class.unique():
temp_df = dataset[dataset['Class'] == cls]
order = temp_df.sort_values('Percentage', ascending = False)['Age']
return order
sns.barplot(x="Class", y="Percentage", hue = 'Age',
hue_order= hue_order(),
data=dataset)
plt.show()
但是,条形仅按Class == 2005
的降序排列。有什么帮助吗?
在我的问题中,我使用的是hue
参数,因此,它不像提议的那样重复。
答案 0 :(得分:1)
seaborn hue
参数为绘图添加了另一个维度。 hue_order
确定此维度的处理顺序。但是你无法拆分该订单。这意味着您可以更改顺序,使Age == 2
位于图中的第三位。但是你不能部分地改变它,这样在某些方面它是在第一个,在另一些方面它将在第三位。
为了实现此处所需,即在同一轴内使用不同的辅助尺寸顺序,您需要手动处理。
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
df = pd.DataFrame({"Class" : [2004]*6+[2005]*7,
"Age" : [3,2,4,6,5,1,2,3,6,4,5,1,9],
"Percentage" : [50,40,30,20,10,30,20,35,40,50,45,30,15]})
def sortedgroupedbar(ax, x,y, groupby, data=None, width=0.8, **kwargs):
order = np.zeros(len(data))
df = data.copy()
for xi in np.unique(df[x].values):
group = data[df[x] == xi]
a = group[y].values
b = sorted(np.arange(len(a)),key=lambda x:a[x],reverse=True)
c = sorted(np.arange(len(a)),key=lambda x:b[x])
order[data[x] == xi] = c
df["order"] = order
u, df["ind"] = np.unique(df[x].values, return_inverse=True)
step = width/len(np.unique(df[groupby].values))
for xi,grp in df.groupby(groupby):
ax.bar(grp["ind"]-width/2.+grp["order"]*step+step/2.,
grp[y],width=step, label=xi, **kwargs)
ax.legend(title=groupby)
ax.set_xticks(np.arange(len(u)))
ax.set_xticklabels(u)
ax.set_xlabel(x)
ax.set_ylabel(y)
fig, ax = plt.subplots()
sortedgroupedbar(ax, x="Class",y="Percentage", groupby="Age", data=df)
plt.show()