我刚刚开始学习R并且需要一些帮助来找到我的数据的残差的均值和中位数。我计算了lm,在摘要中我得到了如下残差:
min 1Q median 3Q Max
-111.86 -34.90 -7.6 33.46 182.58
问题:所以残差的中位数是-7.6,但这是我的意思? 或者是否有计算残差的均值和中位数? 我打算做意思(resid(trees.lm)或者应该输入为mean(trees.lm $ resid)
请澄清,因为我的同学对同一数据集的反应都不同。
答案 0 :(得分:6)
这里的一个具体问题的答案是:
mean(resid(trees.lm))
您不应该深入研究这样的拟合模型对象并去除任意组件。当你意识到你刚刚通过以下方式提取工作残差时,就像GLM这样复杂的事情会让你大吃一惊:
glm.mod.obj$residuals
对你不太可能有用。
即使对于lm()
个对象这样的简单内容,使用resid()
或访问$residuals
的内容也可能会有所不同,具体取决于模型的拟合方式({{1}的设置是什么例如,参数?)。
此外,线性模型假设残差为i.i.d.高斯(或正常)随机变量,均值为0,方差为$ \ hat {\ sigma} ^ 2} $所以均值应非常接近0(即非常非常非常接近0但不完全是因为这是一台计算机和浮点运算正在发挥作用。)