数据集包含47个obs和5个变量(男性编码为0,女性编号为1),试图预测平均状态,收入和口头的男性将花费95%CI。
我使用lm<-spending ~ status + income + verbal + sex, teenspend
来获得平均值。
我发现我的系数为:
mdl$coefficient
(Intercept) sexfemale status income
22.55565063 -22.11833009 0.05223384 4.96197922
verbal
-2.95949350
predict(mdl, sex=0, interval='confidence', level=0.90)
一些问题:我使用了上述预测,但我得到了所有观察结果,如何找到我的预测?
fit lwr upr
1 -10.6507430 -21.4372267 0.1357407
2 -9.3711318 -21.9428731 3.2006095
3 -5.4630298 -15.0782882 4.1522286
4 24.7957487 12.5630143 37.0284831
请澄清一下?
答案 0 :(得分:0)
查看文档中的predict.lm,您会发现此处不能使用参数sex=0
。预测方法忽略该参数,因此您可以获得数据中所有观察值的拟合值加置信区间。您可以通过以下方式指定预测:
predict(mdl, newdata=teenspend[teenspend$sex==0,], interval="confidence")
如果您确实需要预测间隔 - 您在问题的标题中使用它 - 您应该选择interval="prediction"
。