我有:
from scipy import stats
data = stats.gamma.rvs(2, loc=1.5, scale=2, size=100000)
所以我适合那个
fitted_params = scipy.stats.gamma.fit(data)
如何从中计算AIC?
AIC = 2*k - 2*ln(L)
其中k是拟合参数的数量,L是最大对数似然函数
k = len(fitted_params)
aic = 2*k - 2*(logLik)
logLik
会是什么?
我找到了这个片段:
logLik = -np.sum( stats.norm.logpdf(data, loc=yPred, scale=sd) )
我的职能也是如此:
# calc SD of fitted distribution
sd = std(loc=fitted_params[1], scale=fitted_params[2])
# sample values from fitted dist same length as original data array
yPred = rvs(fitted_params[0], loc=fitted_params[1], scale=fitted_params[2], size=len(data), random_state=None)
# calc the log likelihood
logLik = -np.sum( stats.gamma.logpdf(data, loc=yPred, scale=sd) )
答案 0 :(得分:3)
可能性实际上是在给定参数的情况下观察数据的概率。因此,如果您有一些参数值,即拟合值,则可能性是数据的概率,其中密度用拟合值参数化。
因此,你所做的几乎是正确的。由于您是从伽马分布中采样的,因此您还应使用该分布计算可能性。即而不是
logLik = -np.sum( stats.norm.logpdf(data, loc=yPred, scale=sd) )
DO
logLik = np.sum( stats.gamma.logpdf(data, fitted_params[0], loc=fitted_params[1], scale=fitted_params[2]) )
然后你只需使用你的AIC方程即可。