我尝试并排绘制一些作业和测验分数,我有两套对我来说足够相似的代码,但是一组并排产生两个直方图,而另一组则没有。
我正在Windows的Anaconda python 3.6环境中运行代码。以下代码将设置问题
data = pd.DataFrame( np.random.uniform(low = 0.0, high = 100, size = (224,3)))
data.columns = ['Section', 'hw_score', 'quiz_score']
data['Section'] = data['Section'].apply(get_section)
data.head(10)
data['hw_score'].fillna(0,inplace=True)
data['quiz_score'].fillna(0,inplace=True)
data.isnull().sum()
data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
data.quiz_score[data.quiz_score > 0].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
我不确定为什么下面的代码不能产生并排的直方图:
plt.figure( figsize = (15,6) )
plt.subplot(1,2,1)
fig = data.hist(column='hw_score')
fig.set_title('Homework Score')
plt.subplot(1,2,2)
fig = data.hist(column='quiz_score')
fig.set_title('Quiz Score')
,然后执行以下操作:
plt.figure( figsize = (15,6) )
plt.subplot(1,2,1)
fig = data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
fig.set_title('Homework Score')
plt.subplot(1,2,2)
fig = data.quiz_score[data.quiz_score > 0].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
fig.set_title('Quiz Score')
答案 0 :(得分:1)
在您使用失败的代码中,fig
是一个numpy数组,其中第零个元素是AxesSubplot
对象。 pandas
文档warn。
它还告诉您,您可以将ax
直接传递给pandas.DataFrame.hist
,我们可以编辑您的错发代码来做到这一点:
fig = plt.figure( figsize = (15,6) )
ax = fig.add_subplot(1,2,1)
data.hist(column='hw_score', ax=ax)
ax.set_title('Homework Score')
ax = fig.add_subplot(1,2,2)
data.hist(column='quiz_score', ax=ax)
ax.set_title('Quiz Score')
plt.show()
请注意更改:fig
现在是实际图形,ax
是轴。 data.hist
的返回类型是一个小数轴数组,但是我们不需要它,可以决定不将其存储在任何地方。
编辑:因此,您继续询问为什么其他代码块DID起作用。简而言之,这是因为pandas
开发人员喜欢为pandas.DataFrame
和pandas.Series
实现方法。因此,当您致电:
fig = data.hw_score[ data.hw_score > 0 ].hist( bins = [0,10,20,30,40,50,60,70,80,90,100] )
data.hw_score[ data.hw_score > 0 ]
是pandas.Series
。看看pandas.Series.hist
的{{3}},并没有警告说有时会像numpy
一样返回pandas.DataFrame.hist
数组。
由于它不返回包装在数组中的对象,因此我们无需采取任何特殊措施即可访问AxesSubplot
对象。