我有以下数据:
countries2012 = [
'Bolivia',
'Brazil',
'Sri Lanka',
'Dominican Republic',
'Indonesia',
'Kenya',
'Honduras',
'Mozambique',
'Peru',
'Philipines',
'India',
'Vietnam',
'Thailand',
'USA',
'World'
]
percentage2012 = [
0.042780099,
0.16599952,
0.012373058,
0.019171717,
0.011868674,
0.019239173,
0.00000332,
0.014455196,
0.016006654,
0.132970981,
0.077940824,
0.411752517,
0.017986798,
0.017361808,
0.058076027
]
countries2013 = [
'Bolivia',
'Brazil',
'Sri Lanka',
'Dominican Republic',
'Indonesia',
'Honduras',
'Mozambique',
'Peru',
'Philippines',
'India',
'Vietnam',
'Thailand',
'USA',
'World'
]
percentage2013 = [
0.02736294,
0.117160272,
0.015815952 ,
0.018831589,
0.020409103 ,
0.00000000285,
0.018876854,
0.018998639,
0.117221146,
0.067991687,
0.496110972,
0.019309486,
0.026880553,
0.03503080414999993
]
我想绘制一个堆积条形图,以便有一个堆积条形用于2012年,另一个堆积条形用于2013年。
由于2012年和2013年的国家不同,我该如何处理?
答案 0 :(得分:13)
由于此问题要求在 Seaborn 中使用堆积条形图,并且接受的答案使用 pandas
,因此我想我会给出一种实际使用 Seaborn 的替代方法。
Seaborn 给出了一个 stacked bar 示例,但它有点笨拙,绘制总数然后在其上叠加条形图。相反,您实际上可以使用直方图和 weights
参数。
import pandas as pd
import seaborn as sns
# Put data in long format in a dataframe.
df = pd.DataFrame({
'country': countries2012 + countries2013,
'year': ['2012'] * len(countries2012) + ['2013'] * len(countries2013),
'percentage': percentage2012 + percentage2013
})
# One liner to create a stacked bar chart.
ax = sns.histplot(df, x='year', hue='country', weights='percentage',
multiple='stack', palette='tab20c', shrink=0.8)
ax.set_ylabel('percentage')
# Fix the legend so it's not on top of the bars.
legend = ax.get_legend()
legend.set_bbox_to_anchor((1, 1))
答案 1 :(得分:1)
IIUC,您可以创建一个Pandas数据框并使用其绘图功能:
import pandas as pd
df = pd.concat([pd.DataFrame({2012:percentage2012}, index=countries2012),
pd.DataFrame({2013:percentage2013}, index=countries2013)],
axis=1, sort=False)
df.T.plot.bar(stacked=True, figsize=(12,6))
输出:
答案 2 :(得分:0)
以@Quang Hoang的代码为基础,此处尝试以相同顺序获取图例和堆栈(在2012年更正了“ Philippines”之后)。由于某些原因,2012年的百分比之和未达到100%,因此我添加了标准化步骤。此外,我将x标签水平放置,将y标签放置为百分比。
代码:
import pandas as pd
from matplotlib import pyplot as plt
df = pd.concat([pd.DataFrame({'2012':percentage2012[::-1]}, index=countries2012[::-1]) / sum(percentage2012),
pd.DataFrame({'2013':percentage2013[::-1]}, index=countries2013[::-1]) / sum(percentage2013)],
axis=1, sort=False)
df.T.plot.bar(stacked=True, figsize=(12,6), cmap='tab20')
ax = plt.gca()
h, l = ax.get_legend_handles_labels()
plt.legend(h[::-1], l[::-1])
plt.xticks(rotation=0, size=20)
plt.yticks(size=15)
vals = ax.get_yticks()
ax.set_yticklabels(['{:,.0%}'.format(y) for y in vals])
plt.show()