我做了 anova测试 b / w'密度':连续,'质量':catagorical, 但得到了不同的F-statics和p值。
现在我很困惑应该使用哪一个拒绝或支持null 假设
import statsmodels.formula.api as smf
import patsy
formula = 'density ~ C(quality)'
y,x = patsy.dmatrices(formula, wine_train, return_type='dataframe')
smf.OLS(y,x).fit().summary()
F统计量:9.093 问题(F统计):1.73e-08
但是anova测试{f_oneway}给出了不同的F和p值。
wine_train[['density','quality']].groupby('quality').groups
stats.f_oneway(wine_train[['density','quality']].groupby('quality').groups[3],
wine_train[['density','quality']].groupby('quality').groups[4],
wine_train[['density','quality']].groupby('quality').groups[5],
wine_train[['density','quality']].groupby('quality').groups[6],
wine_train[['density','quality']].groupby('quality').groups[7],
wine_train[['density','quality']].groupby('quality').groups[8])
**F_onewayResult(statistic=3.2489023202821761, pvalue=0.0064318288153747899)**
你可以告诉我OLS和f_oneway是不同的或者是sthing。