R平方并用一个预测器调整R平方

时间:2016-05-03 10:08:09

标签: matlab statistics regression

使用以下方法估算MATLAB中的确定系数:

load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));
X2 = X(:,3);
mdl = fitlm(X2,y);

Estimated Coefficients:
                   Estimate       SE       tStat       pValue  
                   ________    ________    ______    __________

    (Intercept)      116.72      3.9389    29.633    1.0298e-50
    x1             0.039357    0.025208    1.5613       0.12168


Number of observations: 100, Error degrees of freedom: 98
Root Mean Squared Error: 6.66
R-squared: 0.0243,  Adjusted R-Squared 0.0143
F-statistic vs. constant model: 2.44, p-value = 0.122

如果我只在线性模型中使用一个预测变量,为什么R 2 和adjust-R 2 值不相同。如果模型中只有一个预测变量,则它们应该是可互换的。我在这里错过了什么?

1 个答案:

答案 0 :(得分:5)

维基百科给出了adjust-R 2 的两个定义:

enter image description here

enter image description here

我猜你的断言R 2 应该等于adjust-R 2 是基于第一个等式,因为 p 1 第二项的分子是 0 。现在我找不到这方面的参考(令人失望的是,维基文章的这一部分没有引用)但我相当确信第一个方程实际上是近似值。

除了符号之外,第二个等式也匹配Introduction to Statistical Learning第212页上的等式6.4,与R 2 不同,因为 df e n - p - 1 df t 只是 n - 1 因此当 p 等于 1 (即只有一个解释变量)时 1 的差异,但差异应该非常小。 Here is a random example,其表格为R 2 ,调整后的R 2 ,即使变量数为1,也显示出差异。

但你的差异非常大。我建议你看看剩余的平方和和平方和,看看你是否可以计算你自己的R 2 和调整后的R 2 值,看它们是否匹配