Matplotlib堆叠条形图:需要交换x和高度

时间:2019-01-09 02:10:24

标签: python python-3.x matplotlib stacked-chart

我正在查看一些世界生态足迹数据,我想制作每种足迹类型的堆叠条形图,其中彼此叠加的值相同,但适用于不同的国家。因此,我开始使用其中两个足迹只是为了使某些东西起作用。

这就是我要工作的(某种):

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Create DataFrame from CSV file
df = pd.read_csv('countries.csv')

# Slice Series out of DF
cropFoot = df['Cropland Footprint']
grazeFoot = df['Grazing Footprint']

# Convert Series to list
cropFoot = list(cropFoot)
grazeFoot = list(grazeFoot)

X = range(163)    # the lists have 163 entries

plt.bar(X, height=cropFoot)
plt.bar(X, height=grazeFoot, bottom = cropFoot)
plt.show()

哪个生成以下图:

Stacked bar chart

我想在x轴上显示5个单独的足迹,因此每个国家/地区的足迹数据相互叠加。本质上,现在X轴显示了163个国家/地区的2个足迹。我要相反。因此,我希望每个条带上堆叠有163个国家/地区的5个条带。

类似这样的东西(但有163个堆叠,而不是7个堆叠):

Goal stacked bar

毫不奇怪,仅交换X和高度...是行不通的。结果根本没有任何意义:

plt.bar(cropFoot, height=X)
plt.bar(grazeFoot, height=X, bottom = cropFoot)

plt.show()

如下所示:

Makes no sense at all.

有关如何正确扭转这一状况的任何建议? This is the dataset I'm using,来自Kaggle。

2 个答案:

答案 0 :(得分:3)

由于您已经在使用数据框,因此您可能需要尝试使用提供的GIF绘图方法,该方法更容易使用。要进行堆栈,只需设置参数stacked=True。但是,堆叠的是列名,因此您必须首先转置数据框。它可能看起来像这样:

footprints = ['Cropland Footprint', 'Grazing Footprint', ...]  # fill with other footprints
data = df[footprints].T
data.plot.bar(stacked=True, legend=False)  # you probably don't want a legend with 163 countries

例如:

df = pd.DataFrame(
    np.arange(200).reshape(40, 5),
    index=[f'i{x}' for x in range(40)],
    columns=[f'c{x}' for x in range(5)]
)
df.T.plot.bar(stacked=True, legend=False)

bar

答案 1 :(得分:1)

我认为@busybear使用数据框条形图的答案更好,但是我认为应该显示使用matplotlib.pyplot.bar的解决方案,因为这样做是为了完整性。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Creates a randomized set of data to use for demonstration
n = 163
m = 5
footprints = np.zeros((m, n))
for ii in range(n):
    for jj in range(m):
        footprints[jj][ii] = random.random()*10

# This line is unnecessary for the example, it is purely for plot aesthetic
fig = plt.figure(figsize=(5, 5), dpi=200)

# colors can be replaced with any list of colors of any length >= 1
colors = plt.rcParams["axes.prop_cycle"].by_key()["color"]
bottom = np.zeros(5)
for ii in range(1, n):
    for jj in range(m):
        plt.bar(jj, height=footprints[jj][ii], bottom=bottom[jj], 
                color=colors[ii % len(colors)])
        bottom[jj] = bottom[jj] + footprints[jj][ii]

plt.show()