如何确定随机周期过程的等待时间的预期值?

时间:2014-03-12 18:21:06

标签: machine-learning statistics probability

自从我做了任何真实的统计数据以来已经有一段时间了,但我希望Stack Overflow社区可以提供帮助。虽然我无法提供确切的应用程序,因为它是专有的,但这是一个同等的问题:

想象一下,你家附近有一个公交车站,但你不知道公交车时刻表。相反,您有一个列表显示公交车去年实际到达的确切时间。我想要做的是计算以下内容:如果你随机走到公交车站,5分钟内公交车的可能性是多少? 10分钟? 20分钟? (我希望得到一份发行版)。

我已经尝试过在谷歌上搜索,并且已经找到了大量使用累积分布函数的例子......但是我还没有找到一个很好的例子来说明如何做我想要的事情。

特别是,我希望使用去年的样本来创建我希望使用的概率分布函数。

有没有人有一个很好的例子说明我会怎么做? (或者有这些数据的网站?)

2 个答案:

答案 0 :(得分:1)

我可以给你一些可能有帮助的建议:

1-为了获得更准确的结果,您需要在一天中的时间(即峰值或非峰值)和星期几(星期几或周末)进行条件分配,因为总线频率取决于这些因子

2-尝试计算以上述因素为条件的两辆公共汽车(即车头时距)之间持续时间的分布。任何人随机到达公交车站的预计等待时间等于一半的进展。

所以我想这样做的方法是将数据集划分为句点(例如工作日的7-10点),然后计算这段时间的进度,这将是我将用于计算预期等待时间的分布随机抵达巴士站

等待时间可以建模为指数分布,我还会测试总线到达过程是否遵循泊松分布(你必须测试数据,做不仅仅是假设它)正如我上面提到的那样,你必须按照一天中的时间和一周中的某一天来调整你的分配。

答案 1 :(得分:0)

我的建议是使用经验分布,即直方图。您可以根据看起来很重要的因素来分割可用数据,例如:在公共汽车的例子中,工作日与周末。请注意,如果到达时间大致是循环的,如您所述,等待时间将取决于您何时开始等待。

在构建直方图并查看它们之后,您可能会发现,通过假设某些特定的分布,您可以简化事情。但是你必须首先使用经验数据来确定是否可能。