我正在查看一些世界生态足迹数据,我想制作每种足迹类型的堆叠条形图,其中彼此叠加的值相同,但适用于不同的国家。因此,我开始使用其中两个足迹只是为了使某些东西起作用。
这就是我要工作的(某种):
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Create DataFrame from CSV file
df = pd.read_csv('countries.csv')
# Slice Series out of DF
cropFoot = df['Cropland Footprint']
grazeFoot = df['Grazing Footprint']
# Convert Series to list
cropFoot = list(cropFoot)
grazeFoot = list(grazeFoot)
X = range(163) # the lists have 163 entries
plt.bar(X, height=cropFoot)
plt.bar(X, height=grazeFoot, bottom = cropFoot)
plt.show()
哪个生成以下图:
我想在x轴上显示5个单独的足迹,因此每个国家/地区的足迹数据相互叠加。本质上,现在X轴显示了163个国家/地区的2个足迹。我要相反。因此,我希望每个条带上堆叠有163个国家/地区的5个条带。
类似这样的东西(但有163个堆叠,而不是7个堆叠):
毫不奇怪,仅交换X和高度...是行不通的。结果根本没有任何意义:
plt.bar(cropFoot, height=X)
plt.bar(grazeFoot, height=X, bottom = cropFoot)
plt.show()
如下所示:
有关如何正确扭转这一状况的任何建议? This is the dataset I'm using,来自Kaggle。
答案 0 :(得分:3)
由于您已经在使用数据框,因此您可能需要尝试使用提供的GIF绘图方法,该方法更容易使用。要进行堆栈,只需设置参数stacked=True
。但是,堆叠的是列名,因此您必须首先转置数据框。它可能看起来像这样:
footprints = ['Cropland Footprint', 'Grazing Footprint', ...] # fill with other footprints
data = df[footprints].T
data.plot.bar(stacked=True, legend=False) # you probably don't want a legend with 163 countries
例如:
df = pd.DataFrame(
np.arange(200).reshape(40, 5),
index=[f'i{x}' for x in range(40)],
columns=[f'c{x}' for x in range(5)]
)
df.T.plot.bar(stacked=True, legend=False)
答案 1 :(得分:1)
我认为@busybear使用数据框条形图的答案更好,但是我认为应该显示使用matplotlib.pyplot.bar
的解决方案,因为这样做是为了完整性。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Creates a randomized set of data to use for demonstration
n = 163
m = 5
footprints = np.zeros((m, n))
for ii in range(n):
for jj in range(m):
footprints[jj][ii] = random.random()*10
# This line is unnecessary for the example, it is purely for plot aesthetic
fig = plt.figure(figsize=(5, 5), dpi=200)
# colors can be replaced with any list of colors of any length >= 1
colors = plt.rcParams["axes.prop_cycle"].by_key()["color"]
bottom = np.zeros(5)
for ii in range(1, n):
for jj in range(m):
plt.bar(jj, height=footprints[jj][ii], bottom=bottom[jj],
color=colors[ii % len(colors)])
bottom[jj] = bottom[jj] + footprints[jj][ii]
plt.show()