从Java中的数据集中查找泊松分布

时间:2013-02-26 06:14:45

标签: java statistics

我在excel中有大量数据集。我想知道数字是否遵循Java中的Poisson DistributionBinomial distribution。是否有任何开源库可以帮助我完成这项工作。我在看Apache Common Math。

任何指针都有帮助吗?

1 个答案:

答案 0 :(得分:0)

听起来你有一个(相对简单的)模型拟合问题,并且你试图在两个发行版之间进行选择。通常这样做的方法如下。

  1. Estimate parameters p_poisson了解数据的泊松分布
  2. Estimate parameters p_binomial用于数据的二项分布。
  3. 计算p(data | p_poisson)p(data | p_binomial)(似然函数)并选择概率较高的那个。
  4. 为了更加一般化,我建议您查看AICBIC以及有关model selection的一般信息。在这种情况下,如果你没有大量的数据,二项式分布应该因过度拟合的可能性而略微受到惩罚,因为它的参数多于泊松。