我在excel中有大量数据集。我想知道数字是否遵循Java中的Poisson Distribution或Binomial distribution。是否有任何开源库可以帮助我完成这项工作。我在看Apache Common Math。
任何指针都有帮助吗?
答案 0 :(得分:0)
听起来你有一个(相对简单的)模型拟合问题,并且你试图在两个发行版之间进行选择。通常这样做的方法如下。
p_poisson
了解数据的泊松分布p_binomial
用于数据的二项分布。p(data | p_poisson)
和p(data | p_binomial)
(似然函数)并选择概率较高的那个。为了更加一般化,我建议您查看AIC,BIC以及有关model selection的一般信息。在这种情况下,如果你没有大量的数据,二项式分布应该因过度拟合的可能性而略微受到惩罚,因为它的参数多于泊松。