我有一个示例数据,我希望得到最合适的分布。我有几个链接表明我可以从scipy.stats
导入分发,但之后我不知道数据的类型。我希望allfitdist()
中的MATLAB
类似于试图将数据拟合到大约20个分布并返回最佳拟合。
allfitdist()
的链接:http://www.mathworks.in/matlabcentral/fileexchange/34943-fit-all-valid-parametric-probability-distributions-to-data
任何帮助都非常值得赞赏。感谢。
答案 0 :(得分:13)
您只需在scipy中创建所有可用分配的列表即可。一个包含两个分布和随机数据的示例:
import numpy as np
import scipy.stats as st
data = np.random.random(10000)
distributions = [st.laplace, st.norm]
mles = []
for distribution in distributions:
pars = distribution.fit(data)
mle = distribution.nnlf(pars, data)
mles.append(mle)
results = [(distribution.name, mle) for distribution, mle in zip(distributions, mles)]
best_fit = sorted(zip(distributions, mles), key=lambda d: d[1])[0]
print 'Best fit reached using {}, MLE value: {}'.format(best_fit[0].name, best_fit[1])