异方位性是否得到了解决?

时间:2017-04-22 05:09:50

标签: r math statistics linear-regression

我创建了两个连续变量收入和费用的线性回归模型。前者是自变量,后者是依赖变量。我最初发现,在观察数据的扩展后,在模型中存在异方差性,然后计算后估计函数(B​​reusch-Pagan检验),其计算出p值<1。 2.2E-16。由于这低于0.05的显着性水平,我拒绝了具有同方差性的零假设,并断定异方差性确实存在。

在尝试纠正异方差时,我使用以下代码对因变量使用box-cox转换:

lmodI = lm(LCF2010$expense ~ LCF2010$income, data=newexcel) #my original Original model
boxcox(lmodI, lambda = seq(0,0.5,0.1)) #Found the ideal lambda value to be 0.35
newexcel <- cbind(newexcel, newexcel$expense^0.35) #Added the new variable to the original dataframe
names(newexcel)[14] <- "Yprime" #Changed the column name to "Yprime"
lmodINew <- lm(Yprime ~ income, data=newexcel) #Created the new linear model

然后我决定将旧模型与新模型进行比较,看看我是否已经纠正了异方差 - 创建了以下诊断图:

原型: original model

新型号: new model

我还对新模型进行了Breusch-Pagan测试,发现p值在p值

我期望新模型的p值高于0.05,所以我不能拒绝零假设,因此具有同方差性。我在box-cox转换过程中做错了什么?

1 个答案:

答案 0 :(得分:2)

从您的情节来看,您似乎有几百个观察结果。请记住,Breusch-Pagan检验基本上是R平方的观测次数,其中R平方来自回归量上残差的辅助回归(参见Wooldridge 2015中的方程[8.16])。如果n很大,则此统计信息将始终拒绝原假设。