OLS和f_oneway(Anova)之间的区别

时间:2018-04-07 13:30:29

标签: python machine-learning statistics anova p-value

  

我做了 anova测试 b / w'密度':连续,'质量':catagorical,   但得到了不同的F-statics和p值。

     

现在我很困惑应该使用哪一个拒绝或支持null   假设

 import  statsmodels.formula.api as smf
 import patsy

formula = 'density ~ C(quality)'
y,x = patsy.dmatrices(formula, wine_train, return_type='dataframe')
smf.OLS(y,x).fit().summary()
  

F统计量:9.093   问题(F统计):1.73e-08

ols result: image

但是anova测试{f_oneway}给出了不同的F和p值。

wine_train[['density','quality']].groupby('quality').groups

stats.f_oneway(wine_train[['density','quality']].groupby('quality').groups[3],
wine_train[['density','quality']].groupby('quality').groups[4],
wine_train[['density','quality']].groupby('quality').groups[5],
wine_train[['density','quality']].groupby('quality').groups[6],
wine_train[['density','quality']].groupby('quality').groups[7],
wine_train[['density','quality']].groupby('quality').groups[8])

**F_onewayResult(statistic=3.2489023202821761, pvalue=0.0064318288153747899)**
  

你可以告诉我OLS和f_oneway是不同的或者是sthing。

0 个答案:

没有答案