Python:matplotlib - 概率质量函数作为直方图

时间:2015-06-17 10:52:20

标签: python python-2.7 matplotlib plot histogram

我想在同一图表上绘制直方图和线图。但是,要做到这一点,我需要将直方图作为概率质量函数,所以我想在y轴上得到一个概率值。但是,我不知道如何做到这一点,因为使用normed选项并没有帮助。下面是我的源代码和使用过的数据的预览。我会非常感谢所有的建议。

data = [12565, 1342, 5913, 303, 3464, 4504, 5000, 840, 1247, 831, 2771, 4005, 1000, 1580, 7163, 866, 1732, 3361, 2599, 4006, 3583, 1222, 2676, 1401, 2598, 697, 4078, 5016, 1250, 7083, 3378, 600, 1221, 2511, 9244, 1732, 2295, 469, 4583, 1733, 1364, 2430, 540, 2599, 12254, 2500, 6056, 833, 1600, 5317, 8333, 2598, 950, 6086, 4000, 2840, 4851, 6150, 8917, 1108, 2234, 1383, 2174, 2376, 1729, 714, 3800, 1020, 3457, 1246, 7200, 4001, 1211, 1076, 1320, 2078, 4504, 600, 1905, 2765, 2635, 1426, 1430, 1387, 540, 800, 6500, 931, 3792, 2598, 5033, 1040, 1300, 1648, 2200, 2025, 2201, 2074, 8737, 324]
plt.style.use('ggplot')
plt.rc('xtick',labelsize=12)
plt.rc('ytick',labelsize=12)
plt.xlabel("Incomes")
plt.hist(data, bins=50, color="blue", alpha=0.5, normed=True)
plt.show() 

2 个答案:

答案 0 :(得分:5)

据我所知,matplotlib没有内置此功能。但是,复制

很容易
    import numpy as np
    heights,bins = np.histogram(data,bins=50)
    heights = heights/sum(heights)
    plt.bar(bins[:-1],heights,width=(max(bins) - min(bins))/len(bins), color="blue", alpha=0.5)

编辑:以下是a similar question的另一种方法:

     weights = np.ones_like(data)/len(data)
     plt.hist(data, bins=50, weights=weights, color="blue", alpha=0.5, normed=False) 

答案 1 :(得分:1)

这是旧的,但是由于我发现它并要在发现一些错误之前要使用它,所以我想为发现的几个修复程序添加注释。在示例中,@ mmdanziger使用plt.bar中的bin边缘,但是,您实际上需要使用bin的中心。他们还假定垃圾箱的宽度相等,这在大多数时候都是可以的。但是您也可以将其传递给宽度数组,以防止您无意间忘记和犯错。因此,这是一个更完整的示例:

import numpy as np
heights, bins = np.histogram(data, bins=50)
heights = heights/sum(heights)
bin_centers = 0.5*(bins[1:] + bins[:-1])
bin_widths = np.diff(bins)
plt.bar(bin_centers, heights, width=bin_widths, color="blue", alpha=0.5)

@mmdanziger将weights = np.ones_like(data)/len(data)传递到plt.hist()的其他选项也做同样的事情,而且对于许多人来说,这是一种更简单的方法。