多项式回归的正态性检验

时间:2017-05-29 14:22:40

标签: r hypothesis-test

在R中,我对下面的数据库使用了多项式回归。它表明R2是好的,系数和模型的显着性水平都小于0.05。但是当使用shapiro.test来测试残差时,p值为0.01088,这意味着残差与正态分布不一致。所以我想知道多项式回归是否有效。多项式回归的残差是否必须满足正态性假设?

下面附有用于回归的代码和数据。

alloy<-data.frame(
  x=c(37.0, 37.5, 38.0, 38.5, 39.0, 39.5, 40.0,
      40.5, 41.0, 41.5, 42.0, 42.5, 43.0),
  y=c(3.40, 3.00, 3.00, 3.27, 2.10, 1.83, 1.53,
      1.70, 1.80, 1.90, 2.35, 2.54, 2.90))

lm.sol=lm(y~x+I(x^2),data=alloy)
summary(lm.sol)

y.res=lm.sol$residuals
shapiro.test(y.res)

1 个答案:

答案 0 :(得分:0)

嗯......这个问题可能属于stat.exchange,因为它与编程没什么关系。但是,这是我对您的数据的简要介绍。

R2和shapiro.test解决了数据和模型拟合的不同特征,因此您可以使用一个“好”*而另一个不是(对于“好”和“不”的定义足够模糊)

如果您在同一图表中绘制数据和拟合,那么您会发现二次回归模型很好地捕获了整体趋势。

plot(y ~ x, data=alloy)
lines(alloy$x, predict(lm.sol))

enter image description here

该模型做得非常好。您还可以看到残差的qq图表明可能存在方差同质性问题(参见最后的残差)。

qqnorm(resid(lm.sol))

enter image description here

换句话说,残差可能不一定遵循高斯分布,但是捕获数据的总体趋势。

这有帮助吗?