需要在Coef上进行说明。和圣埃。 MixedLM结果中的随机参数

时间:2018-10-31 07:52:42

标签: python statsmodels mixed-models random-effects linearmodels

我试图了解Python statsmodel软件包提供的混合线性模型的结果。我想避免数据分析和解释中的陷阱。问题在数据加载/输出代码块之后。

加载数据和拟合模型:

import statsmodels.api as sm
import statsmodels.formula.api as smf
data = sm.datasets.get_rdataset("dietox", "geepack").data
md = smf.mixedlm("Weight ~ Time", data, groups=data["Pig"])
mdf = md.fit()
print mdf.summary()

Mixed Linear Model Regression Results
========================================================
Model:            MixedLM Dependent Variable: Weight    
No. Observations: 861     Method:             REML      
No. Groups:       72      Scale:              11.3669   
Min. group size:  11      Likelihood:         -2404.7753
Max. group size:  12      Converged:          Yes       
Mean group size:  12.0                                  
--------------------------------------------------------
             Coef.  Std.Err.    z    P>|z| [0.025 0.975]
--------------------------------------------------------
Intercept    15.724    0.788  19.952 0.000 14.179 17.268
Time          6.943    0.033 207.939 0.000  6.877  7.008
Group Var    40.394    2.149                            
========================================================

Q1。 (a)组变量系数(参数)到底是什么?我认为这是Group Var(cov_params)的差异,但是默认输出与内置方法输出不匹配。

Q1。 (b)“组变量”参数(参数)是什么意思?

print "-----Parameters-----"
print mdf.params
print
print "-----Covariance matrix-----"
print mdf.cov_params()

-----Parameters-----
Intercept    15.723523
Time          6.942505
Group Var     3.553634
dtype: float64

-----Covariance matrix-----
           Intercept      Time  Group Var
Intercept   0.621028 -0.007222   0.000052
Time       -0.007222  0.001115  -0.000012
Group Var   0.000052 -0.000012   0.406197

Q2。 (a)组Var的标准误(bse)是什么意思?为什么在默认输出中未报告Group Var估计?不重要吗?

Q2。 (b)与方差的标准误差(bse_re)有何不同?

print "-----Standard errors-----"
print mdf.bse
print
print "-----Standard errors of random effects-----"
print mdf.bse_re

-----Standard errors-----
Intercept    0.788053
Time         0.033387
Group Var    0.637336
dtype: float64

-----Standard errors of random effects-----
Group Var    2.148771
dtype: float64

Q3。为什么未在summary()中报告随机参数的t值和p值?

print "-----t-values (or z-values?)-----"
print mdf.tvalues
print
print "-----p-values-----"
print mdf.pvalues

-----t-values (or z-values?)-----
Intercept     19.952366
Time         207.938608
Group Var      5.575760
dtype: float64

-----p-values-----
Intercept    1.429597e-88
Time         0.000000e+00
Group Var    2.464519e-08
dtype: float64

参考:https://www.statsmodels.org/dev/mixed_linear.html

0 个答案:

没有答案