有一个数据集(在这里找到 - https://netfiles.umn.edu/users/nacht001/www/nachtsheim/Kutner/Appendix%20C%20Data%20Sets/APPENC01.txt),我已经为线性回归做了一些R编码。在附加的数据集中,列未标记。我不得不标记数据集的列并将其保存为csv而我道歉我无法在此处获取...但我使用的列是第3列(年龄)第4列(感染)第5列(culratio)第10栏(人口普查)和第12栏(服务),第9栏(区域)。我给数据集医院命名了。
我应该"对于每个地理区域,使用一阶回归模型将感染风险(Y)与预测变量age,culratio,census,service进行回归。然后我需要找到每个地区的MSE。这是我的代码。
NE<- subset(hospital, region=="1")
NC<- subset(hospital, region=="2")
S<- subset(hospital, region=="3")
W<- subset(hospital, region=="4")
然后做一阶线性回归模型我使用每个
的基本代码NE.Model<- lm(NE$infection~ NE$age + NE$culratio + NE$census + NE$service)
summary(NE.Model)
我可以得到调整后的R平方值,但是如何从这个输出中找到MSE?
答案 0 :(得分:1)
将我的评论移至答案。 “错误”或“残差”是模型对象NE.Model$residuals
的一部分,因此获得均方误差就像:mean(NE.Model$residuals^2)
一样简单。
作为一个注释,您可以通过在模型中拟合region
固定效应项,然后计算每个残差子集的MSE,以更少的步骤执行此操作。同样的,真的。