我想创建以下直方图(见下图),取自“Think Stats”一书。但是,我无法将它们放在同一个地块上。每个DataFrame都有自己的子图。
我有以下代码:
import nsfg
import matplotlib.pyplot as plt
df = nsfg.ReadFemPreg()
preg = nsfg.ReadFemPreg()
live = preg[preg.outcome == 1]
first = live[live.birthord == 1]
others = live[live.birthord != 1]
#fig = plt.figure()
#ax1 = fig.add_subplot(111)
first.hist(column = 'prglngth', bins = 40, color = 'teal', \
alpha = 0.5)
others.hist(column = 'prglngth', bins = 40, color = 'blue', \
alpha = 0.5)
plt.show()
当我按照pandas multiple plots not working as hists中的建议使用ax = ax1时,上述代码无法正常工作,此示例也是我需要的:Overlaying multiple histograms using pandas。当我按原样使用代码时,它会创建两个带直方图的窗口。任何想法如何结合它们?
以下是我希望看到最终数字的示例:
答案 0 :(得分:29)
据我所知,大熊猫无法处理这种情况。没关系,因为他们所有的绘图方法都只是为了方便。你需要直接使用matplotlib。我是这样做的:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import pandas
#import seaborn
#seaborn.set(style='ticks')
np.random.seed(0)
df = pandas.DataFrame(np.random.normal(size=(37,2)), columns=['A', 'B'])
fig, ax = plt.subplots()
a_heights, a_bins = np.histogram(df['A'])
b_heights, b_bins = np.histogram(df['B'], bins=a_bins)
width = (a_bins[1] - a_bins[0])/3
ax.bar(a_bins[:-1], a_heights, width=width, facecolor='cornflowerblue')
ax.bar(b_bins[:-1]+width, b_heights, width=width, facecolor='seagreen')
#seaborn.despine(ax=ax, offset=10)
这给了我:
答案 1 :(得分:6)
来自pandas网站(http://pandas.pydata.org/pandas-docs/stable/visualization.html#visualization-hist):
df4 = pd.DataFrame({'a': np.random.randn(1000) + 1, 'b': np.random.randn(1000),
'c': np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
plt.figure();
df4.plot(kind='hist', alpha=0.5)
答案 2 :(得分:3)
如果有人想要将一个直方图绘制在另一个(而不是交替的条形图)上,您只需在要绘制的系列上连续调用.hist()
:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import pandas
np.random.seed(0)
df = pandas.DataFrame(np.random.normal(size=(37,2)), columns=['A', 'B'])
df['A'].hist()
df['B'].hist()
这会给你:
请注意,您调用.hist()
的顺序很重要(第一个将在后面)
答案 3 :(得分:1)
这是片段,在我的情况下,我已经明确指定了bin和range,因为我没有像本书的作者那样处理异常值删除。
fig, ax = plt.subplots()
ax.hist([first.prglngth, others.prglngth], 10, (27, 50), histtype="bar", label=("First", "Other"))
ax.set_title("Histogram")
ax.legend()
请参阅不同大小的example的Matplotlib多重图。
答案 4 :(得分:0)
您制作了两个数据框和一个matplotlib轴
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
df1 = pd.DataFrame({
'data1': np.random.randn(10),
'data2': np.random.randn(10)
})
df2 = df1.copy()
fig, ax = plt.subplots()
df1.hist(column=['data1'], ax=ax)
df2.hist(column=['data2'], ax=ax)
答案 5 :(得分:0)
这可以简单地完成
plt.hist([First, Other], bins = 40, color =('teal','blue'), label=("First", "Other"))
plt.legend(loc='best')
请注意,随着 bin 数量的增加,它可能会成为视觉负担。