使数据适合所有可能的分布并返回最佳拟合

时间:2014-02-07 09:19:28

标签: python numpy matplotlib scipy

我有一个示例数据,我希望得到最合适的分布。我有几个链接表明我可以从scipy.stats导入分发,但之后我不知道数据的类型。我希望allfitdist()中的MATLAB类似于试图将数据拟合到大约20个分布并返回最佳拟合。

allfitdist()的链接:http://www.mathworks.in/matlabcentral/fileexchange/34943-fit-all-valid-parametric-probability-distributions-to-data

任何帮助都非常值得赞赏。感谢。

1 个答案:

答案 0 :(得分:13)

您只需在scipy中创建所有可用分配的列表即可。一个包含两个分布和随机数据的示例:

import numpy as np
import scipy.stats as st


data = np.random.random(10000)
distributions = [st.laplace, st.norm]
mles = []

for distribution in distributions:
    pars = distribution.fit(data)
    mle = distribution.nnlf(pars, data)
    mles.append(mle)

results = [(distribution.name, mle) for distribution, mle in zip(distributions, mles)]
best_fit = sorted(zip(distributions, mles), key=lambda d: d[1])[0]
print 'Best fit reached using {}, MLE value: {}'.format(best_fit[0].name, best_fit[1])