我正在尝试拟合一个模型,其中包含变量TNST
和Seff
的预测变量以及变量AUCMET
的响应。
拟合的结果是:
mdl1 =
Linear regression model:
AUCMET ~ 1 + TNST + Seff
Estimated Coefficients:
Estimate SE tStat pValue
(Intercept) 1251.5 72.176 17.34 1.4406e-58
TNST -2.3058 0.16045 -14.371 1.9579e-42
Seff 13.087 1.0748 12.176 9.4907e-32
Number of observations: 932, Error degrees of freedom: 929
Root Mean Squared Error: 322
R-squared: 0.197, Adjusted R-Squared 0.195
F-statistic vs. constant model: 114, p-value = 5.36e-45
anova analisis的结果是
anova(mdl1)
ans =
SumSq DF MeanSq F pValue
TNST 2.1395e+07 1 2.1395e+07 206.52 1.9579e-42
Seff 1.5359e+07 1 1.5359e+07 148.25 9.4907e-32
Error 9.6243e+07 929 1.036e+05
诊断图的输出是
plotDiagnostics(mdl)
你能帮我解释一下这个结果吗?我看到所有的p都是<因此它们的变量对于模型很重要。 这是一个好模特吗?我该怎么看才能理解它?
答案 0 :(得分:1)
r平方/调整后的r平方是Pearson相关系数。 https://en.m.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient
A 1是好的0是坏的所以我会说这是一个诗歌不好的模型。
答案 1 :(得分:1)
修改:现在您已使用新信息编辑了问题:
1-从情节诊断测试中可以看出,有一定比例的高杠杆点。但这个情节并没有揭示高杠杆点是否是异常值。尝试plotDiagnostics(mdl,'cookd')
查找异常值(具有较大库克距离的点)并将其从数据中删除。
2- ANOVA表显示两个变量都很重要,您无法考虑删除它们。
没有。在诸如预测人类行为(例如心理学)的领域中,R平方值很低,因为人的行为很难预测。 此外,如果获得的R平方值低但预测良好,则模型计为良好模型。因此,低R平方并不一定会影响重要变量的解释。 R平方应该有多高才能进行预测?那么,这取决于您对预测间隔宽度的要求以及数据中存在多少可变性。虽然精确预测需要高R平方,但正如我们将要看到的那样,它本身并不足够。另一方面,高R平方值本身并不好。高R平方并不一定表明该模型具有良好的拟合。 (read more)
要检查模型的质量,您可以执行其他测试,例如
要检查拟合模型的质量,请参阅ANOVA表。
tbl = anova(mdl)
诊断图可帮助您识别异常值,并查看模型或拟合中的其他问题。
plotDiagnostics(mdl)
有几个残差图可帮助您发现模型或数据中的错误,异常值或相关性。最简单的残差图是默认的直方图,它显示了残差及其频率的范围,以及概率图,它显示了残差的分布如何与具有匹配方差的正态分布进行比较。
plotResiduals(mdl)