泊松分布的极大似然估计?

时间:2011-05-17 00:47:14

标签: java algorithm math statistics multiplatform

我有一个带有观测值(x,y)的表,需要估计更接近它们的泊松分布的平均值。似乎R和Octave都可以​​在Linux上执行此操作,但我想知道是否有多平台方式来执行此操作。我可以用程序捆绑任何东西,但我不能要求安装任何东西让它运行。

我尝试自己搜索算法但找不到,所以我不知道该怎么办。

为了记录,我确实找到了一个简单的算法,它基本上将所有值相加并除以示例的数量,但即使是直接从书中获取的一个简单示例也会失败。

示例:

requisitions per day : absolute frequency (days) : relative frequency
 8 :  2 : 0.016
 9 :  4 : 0.033
10 :  6 : 0.050
11 :  8 : 0.066
12 : 10 : 0.083
13 : 12 : 0.100
14 : 13 : 0.108
15 : 14 : 0.116
16 : 12 : 0.100
17 : 10 : 0.083
18 :  9 : 0.075
19 :  7 : 0.058
20 :  5 : 0.041
21 :  3 : 0.025
22 :  2 : 0.016
23 :  2 : 0.016
24 :  1 : 0.008

Poisson分布的均值应为15(根据我得到的例子)。我在上面说过并且在其中一个答案中的方法给了我16.使用平方欧氏距离的总和,我还发现平均值为15的泊松比平均值16的泊松更接近数据。

1 个答案:

答案 0 :(得分:4)

均值的MLE只是样本均值。见维基百科:

http://en.wikipedia.org/wiki/Poisson_distribution#Maximum_likelihood

平均你的数据向量。

更新:我现在根据刚刚添加到问题中的示例数据扩展此答案。

我对样本数据的解释是

reqs-per-day   frequency
 8             2
 9             4
10             6

表示有两天的申请人数为每天8天。申请人数为9天的四天。因此,我假设数据相当于:

8,8,9,9,9,9,10,10,10,10,10,10,...

此列表中的每个条目对应一天。此列表的顺序无关紧要。我想你应该平均这个清单。

频率字段的总和为120.我认为这意味着实验中共有120天。