Scipy:poisson不适用于特定的数据集

时间:2015-03-13 10:24:41

标签: python numpy scipy

我写了一个脚本以适应泊松分布,它似乎适用于使用python的random.poisson生成的数据集,但它确实适用于我需要适合的数据集。 脚本是:

In [6]: from scipy.misc import factorial

In [7]: from scipy.optimize import curve_fit

In [8]: import numpy as np

In [9]: import matplotlib.pyplot as plt


In [11]: def poisson(k, lambd):
   ....:     print(lambd)
   ....:     return(lambd**k/factorial(k))*np.exp(-lambd)

数据是:

In [12]: x = [ 0.0036533, 0.00972361, 0.01579392, 0.02186422, 0.02793453, 0.03400484, 0.04007515, 0.04614546, 0.05221577, 0.05828608, 0.06435639, 0.0704267, 0.07649701, 0.08256731, 0.08863762]

In [13]: y =[ 0.64005518, 0.10825634, 0.05954099, 0.04330254, 0.03383011, 0.02165127, 0.02435768, 0.01623845, 0.01082563, 0.00676602, 0.00947243, 0.00947243, 0.00270641, 0.00405961, 0.00947243]

In [18]: popt, pcov = curve_fit(poisson, x, y)

所以问题是这个scipt(= 2.82)找到的lambd的最大值远高于它应该的值。 有人可以帮忙吗? 提前致谢

1 个答案:

答案 0 :(得分:2)

泊松分布是discrete probability distribution。因此,它不适合您的x变量数组中的非离散(即非整数)数字。

它适用于通过random.poisson提供的随机数据的原因是这些数据是离散的,而不是连续的。

您应该选择continuous的替代分发。