我有一组数据,我使用pandas数据框加载到python中。我想要做的是创建一个循环,为自己的框架中的所有元素打印一个图,而不是一个。我的数据是以这种方式构建的excel文件:
Index | DATE | AMB CO 1 | AMB CO 2 |...|AMB CO_n | TOTAL
1 | 1/1/12| 14 | 33 |...| 236 | 1600
. | ... | ... | ... |...| ... | ...
. | ... | ... | ... |...| ... | ...
. | ... | ... | ... |...| ... | ...
n
这是我到目前为止的代码:
import pandas as pd
import matplotlib.pyplot as plt
ambdf = pd.read_excel('Ambulance.xlsx',
sheetname='Sheet2', index_col=0, na_values=['NA'])
print type(ambdf)
print ambdf
print ambdf['EAS']
amb_plot = plt.plot(ambdf['EAS'], linewidth=2)
plt.title('EAS Ambulance Numbers')
plt.xlabel('Month')
plt.ylabel('Count of Deliveries')
print amb_plot
for i in ambdf:
print plt.plot(ambdf[i], linewidth = 2)
我正在考虑做这样的事情:
for i in ambdf:
ambdf_plot = plt.plot(ambdf, linewidth = 2)
以上并不是我想要的,它源于我对Pandas,MatplotLib等的不熟悉,看一些文档虽然对我来说看起来甚至不需要matplotlib(问题2)
所以A)如何为我的df中的每一列生成数据图 和B)我是否需要使用matplotlib或者我应该只使用pandas来完成所有工作?
谢谢,
答案 0 :(得分:32)
好的,所以创建几个图的最简单方法是:
import matplotlib.pyplot as plt
x=[[1,2,3,4],[1,2,3,4],[1,2,3,4],[1,2,3,4]]
y=[[1,2,3,4],[1,2,3,4],[1,2,3,4],[1,2,3,4]]
for i in range(len(x)):
plt.figure()
plt.plot(x[i],y[i])
请注意,您需要每次创建figure
或pyplot
将在创建的第一个中进行绘制。
如果您想创建多个数据系列,您只需要:
import matplotlib.pyplot as plt
x=[[1,2,3,4],[1,2,3,4],[1,2,3,4],[1,2,3,4]]
y=[[1,2,3,4],[2,3,4,5],[3,4,5,6],[7,8,9,10]]
plt.plot(x[0],y[0],'r',x[1],y[1],'g',x[2],y[2],'b',x[3],y[3],'k')
您可以通过使用['r','g','b','k']
之类的颜色列表自动化它,然后只调用此列表中的两个条目以及相应的数据,如果您愿意,可以在循环中绘制。如果你只是想以编程方式将数据系列添加到一个图中,那么就会这样做(每次都不会创建新的图形,所以所有内容都绘制在同一图中):
import matplotlib.pyplot as plt
x=[[1,2,3,4],[1,2,3,4],[1,2,3,4],[1,2,3,4]]
y=[[1,2,3,4],[2,3,4,5],[3,4,5,6],[7,8,9,10]]
colours=['r','g','b','k']
for i in range(len(x)):
plt.plot(x[i],y[i],colours[i])
希望这会有所帮助。如果matplotlib有一个非常好的documentation page,有很多examples。
答案 1 :(得分:7)
您还可以使用允许您对图表进行更多控制的词典:
import matplotlib.pyplot as plt
# plot 0 plot 1 plot 2 plot 3
x=[[1,2,3,4],[1,4,3,4],[1,2,3,4],[9,8,7,4]]
y=[[3,2,3,4],[3,6,3,4],[6,7,8,9],[3,2,2,4]]
plots = zip(x,y)
def loop_plot(plots):
figs={}
axs={}
for idx,plot in enumerate(plots):
figs[idx]=plt.figure()
axs[idx]=figs[idx].add_subplot(111)
axs[idx].plot(plot[0],plot[1])
return figs, axs
figs, axs = loop_plot(plots)
现在您可以轻松选择要修改的绘图:
axs[0].set_title("Now I can control it!")
答案 2 :(得分:1)
以下是两个如何在单独的窗口(框架)中生成图形的示例,以及一个如何生成图形并将其保存到单独的图形文件中的示例。
好的,首先是屏幕上的示例。请注意,对于每个图形,我们使用单独的 plt.figure()实例,并带有 plt.plot()。最后,我们必须调用 plt.show()将其全部显示在屏幕上。
import matplotlib.pyplot as plt
import numpy as np
x = np.linspace( 0,10 )
for n in range(3):
y = np.sin( x+n )
plt.figure()
plt.plot( x, y )
plt.show()
另一种方法是在循环内使用plt.show(block = False):
import matplotlib.pyplot as plt
import numpy as np
x = np.linspace( 0,10 )
for n in range(3):
y = np.sin( x+n )
plt.figure()
plt.plot( x, y )
plt.show( block=False )
现在,让我们生成图形,然后将它们分别写入文件中。在这里,我们用 plt.savefig(filename)替换plt.show()。与上一个示例的不同之处在于,我们不必在每个图形上都考虑“阻塞”。还要注意,我们为文件名编号。在这里,我们使用%03d,以便以后可以方便地按编号顺序使用它们。
import matplotlib.pyplot as plt
import numpy as np
x = np.linspace( 0,10 )
for n in range(3):
y = np.sin( x+n )
plt.figure()
plt.plot( x, y )
plt.savefig('myfilename%03d.png'%(n))
答案 3 :(得分:1)
如果您的要求是针对一列进行绘图,则可以随意使用此(首先将数据导入熊猫 DF)(绘制具有 5 列和所需行数的图矩阵):< /p>
import math
i,j=0,0
PLOTS_PER_ROW = 5
fig, axs = plt.subplots(math.ceil(len(df.columns)/PLOTS_PER_ROW),PLOTS_PER_ROW, figsize=(20, 60))
for col in df.columns:
axs[i][j].scatter(df['target_col'], df[col], s=3)
axs[i][j].set_ylabel(col)
j+=1
if j%PLOTS_PER_ROW==0:
i+=1
j=0
plt.show()
答案 4 :(得分:0)
我们可以创建一个for循环并将所有数字列传递给它。 循环将在单独的窗格中逐一绘制图形,因为我们将 plt.figure()插入其中。
import pandas as pd
import seaborn as sns
import numpy as np
numeric_features=[x for x in data.columns if data[x].dtype!="object"]
#taking only the numeric columns from the dataframe.
for i in data[numeric_features].columns:
plt.figure(figsize=(12,5))
plt.title(i)
sns.boxplot(data=data[i])
答案 5 :(得分:0)
一种在不同帧上绘图的简单方法如下:
import matplotlib.pyplot as plt
for grp in list_groups:
plt.figure()
plt.plot(grp)
plt.show()
然后python将为每次迭代绘制多个帧。