如果这是一个非常基本的问题,我很抱歉,但我想确保我做对了。我有一些似乎符合泊松过程特征的时间序列数据。数据来自一个模拟过程,我可以在其中监控一段时间内的事件,从中我可以确定等待时间(即事件之间的时间)。
等待时间存储在一个数组waittimes中,我计算平均等待时间
mean=numpy.mean(waittimes)
然后我计算一个以平均值为系数的指数。
samples = numpy.random.exponential(mean,size=10000)
最后,我用下面的代码来计算一个“经验”累积分布函数(ecdf)
def ecdf(data):
# Number of data points: n
n = len(data)
# x-data for the ECDF: x
x = numpy.sort(data)[::-1]
# y-data for the ECDF: y
y = numpy.arange(1, n+1) / n
return x,y
确定经验数据和指数数据的 ECDF
x,y=ecdf(waittimes)
x_theor,y_theor=ecdf(samples)
绘制 (x,y) 和 (x_theor, y_theor) 给出了合理的一致性,表明等待时间呈指数分布。
不幸的是,我对泊松过程的了解并不正确。在这里的某个地方,我假设我应该能够计算泊松率参数,并绘制一个类似于上面的 ecdf 的泊松 cdf,但是如何实现呢?等待时间的平均值是否与泊松过程中的速率相同,或者类似于 rate=1/mean 或不同的东西?
非常感谢!
答案 0 :(得分:0)
泊松分布中的参数 lambda
是预期的事件数量,并且是无量纲的——它不是一个速率,它的维数与时间相反。
如果大小为 T
的窗口中的事件数量遵循参数为 lambda
(无维度)的泊松分布,则事件之间的等待时间应遵循均值为 {{1} 的指数分布}(时间)。