我想知道一种使用Python和scipy执行ANCOVA(协方差分析)的方法。它基本上是回归线的统计比较。我知道Python可以做ANOVA,它也可以用Scipy.stats进行回归线拟合。如果有可能的话,我不知道如何将它们放在一起以获得有效的ANCOVA。
答案 0 :(得分:11)
ANCOVA可以通过设计矩阵中的虚拟变量进行回归,以获得依赖于分类变量的效果。
一个简单的例子是 http://groups.google.com/group/pystatsmodels/browse_thread/thread/aaa31b08f3df1a69?hl=en 使用scikits.statsmodels中的OLS类
设计矩阵构造的相关部分 xg包括组号/标签, x1是连续解释变量
>>> dummy = (xg[:,None] == np.unique(xg)).astype(float)
>>> X = np.c_[x1, dummy[:,1:], np.ones(nsample)]
估算模型
>>> res2 = sm.OLS(y, X).fit()
>>> print res2.params
[ 1.00901524 3.08466166 -2.84716135 9.94655423]
>>> print res2.bse
[ 0.07499873 0.71217506 1.16037215 0.38826843]
>>> prstd, iv_l, iv_u = wls_prediction_std(res2)
“测试假设所有群体都有相同的拦截”
>>> R = [[0, 1, 0, 0],
... [0, 0, 1, 0]]
>>> print res2.f_test(R)
<F test: F=array([[ 91.69986847]]), p=[[ 8.90826383e-17]],
df_denom=46, df_num=2>
强烈拒绝,因为拦截的差异非常大
更新(两年半之后):
scikits.statsmodels
已重命名为statsmodels
以及问题:
使用最新版本的statsmodel,使用公式指定分类效果和交互效果会更方便。 statsmodels
使用patsy来处理公式并创建设计矩阵。