我正在使用SimPy
执行简单队列的模拟。关于该系统的一个问题是访问者等待时间的分布是什么。我所做的是绘制模拟过程中得到的样本的标准化直方图。
这种分布不是纯粹连续的,我们有一个非零概率的等待时间正好为零,因此在左端附近的峰值。我想从图片中以某种方式显而易见,确切地点击0
的实际概率是多少。现在,峰值的高度不能正确显示,高度甚至高于1(原因是许多点击中接近零的小段)。
所以问题是这种分布的一般可视化技术是连续和离散的混合。
答案 0 :(得分:1)
(基于对OP的评论中的讨论)。
对于某个变量的分布,将其称为t
,是离散和连续分量的混合,我将pdf写成一组delta-peak和一个连续部分的总和,< / p>
p(t) = \sum_{a} p_a \delta(t-t_a) + f(t)
其中a
枚举离散值t_a
和p_a
是t_a
的概率,而f(t)
是分布连续部分的pdf,因此f(t)dt
是t
属于[t,t+dt)
的概率。
请注意,整个事情都已归一化,\int p(t) =1
其中积分超过适当范围t
。
现在,为了使这个可视化,我将分离离散组件,并将它们绘制为离散值(作为窄区或带有下拉线的点等)。然后对于其余部分,我将使用直方图,您可以从上面的等式中知道正确的归一化:直方图下的面积应总计为1-\sum_a p_a
。
我并没有声称这是 方式,这正是我要做的。