使用离散分量绘制分布的直方图

时间:2012-06-26 08:27:19

标签: python visualization distribution histogram data-visualization

我正在使用SimPy执行简单队列的模拟。关于该系统的一个问题是访问者等待时间的分布是什么。我所做的是绘制模拟过程中得到的样本的标准化直方图。

Simply using the histogram plot

这种分布不是纯粹连续的,我们有一个非零概率的等待时间正好为零,因此在左端附近的峰值。我想从图片中以某种方式显而易见确切地点击0 的实际概率是多少。现在,峰值的高度不能正确显示,高度甚至高于1(原因是许多点击中接近零的小段)。

所以问题是这种分布的一般可视化技术是连续和离散的混合。

1 个答案:

答案 0 :(得分:1)

(基于对OP的评论中的讨论)。

对于某个变量的分布,将其称为t,是离散和连续分量的混合,我将pdf写成一组delta-peak和一个连续部分的总和,< / p>

p(t) = \sum_{a} p_a \delta(t-t_a) + f(t)

其中a枚举离散值t_ap_at_a的概率,而f(t)是分布连续部分的pdf,因此f(t)dtt属于[t,t+dt)的概率。

请注意,整个事情都已归一化,\int p(t) =1其中积分超过适当范围t

现在,为了使这个可视化,我将分离离散组件,并将它们绘制为离散值(作为窄区或带有下拉线的点等)。然后对于其余部分,我将使用直方图,您可以从上面的等式中知道正确的归一化:直方图下的面积应总计为1-\sum_a p_a

我并没有声称这是 方式,这正是我要做的。