我需要从一组线性回归参数(y = ax + b,我的数据是参数a)中提取出一组数据的机密错误。
我从数据中绘制了直方图。我正在使用python。我得到了这个情节:
我的统计数据不好。我确实需要建议。我需要检查数据的分布并提取其机密错误:
-如何分析曲线不适合直方图大小的时间?
-如何检查发行版本是否与正常法律兼容?还是必须使用其他法律?
这是我用来绘制正态分布曲线的代码,
from scipy import stats
import numpy as np
import matplotlib.pylab as plt
import seaborn as sns
values = [6.460042e-10, 4.173214e-19, 8.806035e-17, 8.826609e-17]
sns.distplot(values)
# find minimum and maximum of xticks, so we know
# where we should compute theoretical distribution
xt = plt.xticks()[0]
xmin, xmax = min(xt), max(xt)
lnspc = np.linspace(xmin, xmax, len(values))
# The normal distribution
m, s = stats.norm.fit(values) # mean and standard deviation
pdf_g = stats.norm.pdf(lnspc, m, s) # now get theoretical values in our interval
print('theoretical values in our interval'+str(pdf_g))
plt.plot(lnspc, pdf_g, label="Norm") # plot it
# exactly same as above
ag,bg,cg = stats.gamma.fit(values)
pdf_gamma = stats.gamma.pdf(lnspc, ag, bg,cg)
plt.plot(lnspc, pdf_gamma, label="Gamma")
ab,bb,cb,db = stats.beta.fit(values)
pdf_beta = stats.beta.pdf(lnspc, ab, bb,cb, db)
plt.plot(lnspc, pdf_beta, label="Beta")
plt.show()