Question

如果这是一个非常基本的问题，我很抱歉，但我想确保我做对了。我有一些似乎符合泊松过程特征的时间序列数据。数据来自一个模拟过程，我可以在其中监控一段时间内的事件，从中我可以确定等待时间（即事件之间的时间）。

等待时间存储在一个数组waittimes中，我计算平均等待时间

    mean=numpy.mean(waittimes)

然后我计算一个以平均值为系数的指数。

    samples = numpy.random.exponential(mean,size=10000)

最后，我用下面的代码来计算一个“经验”累积分布函数（ecdf）

def ecdf(data):
    # Number of data points: n                                                  
    n = len(data)

    # x-data for the ECDF: x                                                    
    x = numpy.sort(data)[::-1]                                                 

    # y-data for the ECDF: y                                                                                                 
    y = numpy.arange(1, n+1) / n

    return x,y

确定经验数据和指数数据的 ECDF

    x,y=ecdf(waittimes)
    x_theor,y_theor=ecdf(samples)

绘制 (x,y) 和 (x_theor, y_theor) 给出了合理的一致性，表明等待时间呈指数分布。

不幸的是，我对泊松过程的了解并不正确。在这里的某个地方，我假设我应该能够计算泊松率参数，并绘制一个类似于上面的 ecdf 的泊松 cdf，但是如何实现呢？等待时间的平均值是否与泊松过程中的速率相同，或者类似于 rate=1/mean 或不同的东西？

非常感谢！

Answer 1

泊松分布中的参数 lambda 是预期的事件数量，并且是无量纲的——它不是一个速率，它的维数与时间相反。

如果大小为 T 的窗口中的事件数量遵循参数为 lambda（无维度）的泊松分布，则事件之间的等待时间应遵循均值为 {{1} 的指数分布}（时间）。

关于泊松过程的困惑

1 个答案: