低R平方是不是很差？

Question

我正在尝试拟合一个模型，其中包含变量TNST和Seff的预测变量以及变量AUCMET的响应。拟合的结果是：

    mdl1 = 


Linear regression model:
    AUCMET ~ 1 + TNST + Seff

Estimated Coefficients:
                   Estimate    SE         tStat      pValue    
    (Intercept)     1251.5      72.176      17.34    1.4406e-58
    TNST           -2.3058     0.16045    -14.371    1.9579e-42
    Seff            13.087      1.0748     12.176    9.4907e-32


Number of observations: 932, Error degrees of freedom: 929
Root Mean Squared Error: 322
R-squared: 0.197,  Adjusted R-Squared 0.195
F-statistic vs. constant model: 114, p-value = 5.36e-45

anova analisis的结果是

anova(mdl1)

ans = 

             SumSq         DF     MeanSq        F         pValue    
    TNST     2.1395e+07      1    2.1395e+07    206.52    1.9579e-42
    Seff     1.5359e+07      1    1.5359e+07    148.25    9.4907e-32
    Error    9.6243e+07    929     1.036e+05

诊断图的输出是

plotDiagnostics(mdl)

你能帮我解释一下这个结果吗？我看到所有的p都是＆lt;因此它们的变量对于模型很重要。这是一个好模特吗？我该怎么看才能理解它？

Answer 1

r平方/调整后的r平方是Pearson相关系数。 https://en.m.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient

A 1是好的0是坏的所以我会说这是一个诗歌不好的模型。

Answer 2

修改：现在您已使用新信息编辑了问题：

1-从情节诊断测试中可以看出，有一定比例的高杠杆点。但这个情节并没有揭示高杠杆点是否是异常值。尝试plotDiagnostics(mdl,'cookd')查找异常值（具有较大库克距离的点）并将其从数据中删除。

2- ANOVA表显示两个变量都很重要，您无法考虑删除它们。

低R平方是不是很差？

没有。在诸如预测人类行为（例如心理学）的领域中，R平方值很低，因为人的行为很难预测。此外，如果获得的R平方值低但预测良好，则模型计为良好模型。因此，低R平方并不一定会影响重要变量的解释。 R平方应该有多高才能进行预测？那么，这取决于您对预测间隔宽度的要求以及数据中存在多少可变性。虽然精确预测需要高R平方，但正如我们将要看到的那样，它本身并不足够。另一方面，高R平方值本身并不好。高R平方并不一定表明该模型具有良好的拟合。（read more）

下一步做什么？

要检查模型的质量，您可以执行其他测试，例如

的 ANOVA

要检查拟合模型的质量，请参阅ANOVA表。

tbl = anova(mdl)

诊断图

诊断图可帮助您识别异常值，并查看模型或拟合中的其他问题。

plotDiagnostics(mdl)

的残差

有几个残差图可帮助您发现模型或数据中的错误，异常值或相关性。最简单的残差图是默认的直方图，它显示了残差及其频率的范围，以及概率图，它显示了残差的分布如何与具有匹配方差的正态分布进行比较。

plotResiduals(mdl)

和more

解释结果线性回归matlab

2 个答案:

低R平方是不是很差？

下一步做什么？