我正在尝试根据Pandas groupby对象生成子图的网格。我希望每个绘图都基于groupby对象的一组的两列数据。假数据集:
C1,C2,C3,C4
1,12,125,25
2,13,25,25
3,15,98,25
4,12,77,25
5,15,889,25
6,13,56,25
7,12,256,25
8,12,158,25
9,13,158,25
10,15,1366,25
我尝试过以下代码:
import pandas as pd
import csv
import matplotlib as mpl
import matplotlib.pyplot as plt
import math
#Path to CSV File
path = "..\\fake_data.csv"
#Read CSV into pandas DataFrame
df = pd.read_csv(path)
#GroupBy C2
grouped = df.groupby('C2')
#Figure out number of rows needed for 2 column grid plot
#Also accounts for odd number of plots
nrows = int(math.ceil(len(grouped)/2.))
#Setup Subplots
fig, axs = plt.subplots(nrows,2)
for ax in axs.flatten():
for i,j in grouped:
j.plot(x='C1',y='C3', ax=ax)
plt.savefig("plot.png")
但是它会生成4个相同的子图,每个子图上都绘制了所有数据(参见下面的示例输出):
我想做以下的事情来解决这个问题:
for i,j in grouped:
j.plot(x='C1',y='C3',ax=axs)
next(axs)
但我收到此错误
AttributeError:'numpy.ndarray'对象没有属性'get_figure'
我想要绘制的groupby对象中的动态数量的组,以及比我提供的假数据更多的元素。这就是为什么我需要一个优雅的动态解决方案,并且每个组数据集都绘制在一个单独的子图上。
答案 0 :(得分:11)
听起来你想要遍历组和轴并行,所以而不是嵌套for
循环(迭代所有组每个 >轴),你想要这样的东西:
for (name, df), ax in zip(grouped, axs.flat):
df.plot(x='C1',y='C3', ax=ax)
您在第二个代码段中有正确的想法,但是您收到错误,因为axs
是一个轴数组,但plot
只需要一个轴。因此,您应该使用next(axs)
替换示例中的ax = axs.next()
,并将plot
的参数更改为ax=ax
。