解释结果线性回归matlab

时间:2015-08-10 13:54:33

标签: matlab regression interpretation

我正在尝试拟合一个模型,其中包含变量TNSTSeff的预测变量以及变量AUCMET的响应。 拟合的结果是:

    mdl1 = 


Linear regression model:
    AUCMET ~ 1 + TNST + Seff

Estimated Coefficients:
                   Estimate    SE         tStat      pValue    
    (Intercept)     1251.5      72.176      17.34    1.4406e-58
    TNST           -2.3058     0.16045    -14.371    1.9579e-42
    Seff            13.087      1.0748     12.176    9.4907e-32


Number of observations: 932, Error degrees of freedom: 929
Root Mean Squared Error: 322
R-squared: 0.197,  Adjusted R-Squared 0.195
F-statistic vs. constant model: 114, p-value = 5.36e-45

enter image description here

anova analisis的结果是

anova(mdl1)

ans = 

             SumSq         DF     MeanSq        F         pValue    
    TNST     2.1395e+07      1    2.1395e+07    206.52    1.9579e-42
    Seff     1.5359e+07      1    1.5359e+07    148.25    9.4907e-32
    Error    9.6243e+07    929     1.036e+05  

诊断图的输出是

plotDiagnostics(mdl)

enter image description here 你能帮我解释一下这个结果吗?我看到所有的p都是<因此它们的变量对于模型很重要。 这是一个好模特吗?我该怎么看才能理解它?

2 个答案:

答案 0 :(得分:1)

r平方/调整后的r平方是Pearson相关系数。 https://en.m.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient

A 1是好的0是坏的所以我会说这是一个诗歌不好的模型。

答案 1 :(得分:1)

修改:现在您已使用新信息编辑了问题:

1-从情节诊断测试中可以看出,有一定比例的高杠杆点。但这个情节并没有揭示高杠杆点是否是异常值。尝试plotDiagnostics(mdl,'cookd')查找异常值(具有较大库克距离的点)并将其从数据中删除。

2- ANOVA表显示两个变量都很重要,您无法考虑删除它们。

低R平方是不是很差?

没有。在诸如预测人类行为(例如心理学)的领域中,R平方值很低,因为人的行为很难预测。 此外,如果获得的R平方值低但预测良好,则模型计为良好模型。因此,低R平方并不一定会影响重要变量的解释。 R平方应该有多高才能进行预测?那么,这取决于您对预测间隔宽度的要求以及数据中存在多少可变性。虽然精确预测需要高R平方,但正如我们将要看到的那样,它本身并不足够。另一方面,高R平方值本身并不好。高R平方并不一定表明该模型具有良好的拟合。 (read more

下一步做什么?

要检查模型的质量,您可以执行其他测试,例如

  1. ANOVA
  2. 要检查拟合模型的质量,请参阅ANOVA表。

    tbl = anova(mdl)
    
    1. 诊断图
    2. 诊断图可帮助您识别异常值,并查看模型或拟合中的其他问题。

      plotDiagnostics(mdl)
      
      1. 残差
      2. 有几个残差图可帮助您发现模型或数据中的错误,异常值或相关性。最简单的残差图是默认的直方图,它显示了残差及其频率的范围,以及概率图,它显示了残差的分布如何与具有匹配方差的正态分布进行比较。

        plotResiduals(mdl)
        
        1. more