Question

使用以下方法估算MATLAB中的确定系数：

load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));
X2 = X(:,3);
mdl = fitlm(X2,y);

Estimated Coefficients:
                   Estimate       SE       tStat       pValue  
                   ________    ________    ______    __________

    (Intercept)      116.72      3.9389    29.633    1.0298e-50
    x1             0.039357    0.025208    1.5613       0.12168


Number of observations: 100, Error degrees of freedom: 98
Root Mean Squared Error: 6.66
R-squared: 0.0243,  Adjusted R-Squared 0.0143
F-statistic vs. constant model: 2.44, p-value = 0.122

如果我只在线性模型中使用一个预测变量，为什么R ²和adjust-R ²值不相同。如果模型中只有一个预测变量，则它们应该是可互换的。我在这里错过了什么？

Answer 1

维基百科给出了adjust-R ²的两个定义：

和

我猜你的断言R ²应该等于adjust-R ²是基于第一个等式，因为 p 1 第二项的分子是 0 。现在我找不到这方面的参考（令人失望的是，维基文章的这一部分没有引用）但我相当确信第一个方程实际上是近似值。

除了符号之外，第二个等式也匹配Introduction to Statistical Learning第212页上的等式6.4，与R ²不同，因为 df _e 是 n - p - 1 而 df _t 只是 n - 1 因此当 p 等于 1 （即只有一个解释变量）时 1 的差异，但差异应该非常小。 Here is a random example，其表格为R ²，调整后的R ²，即使变量数为1，也显示出差异。

但你的差异非常大。我建议你看看剩余的平方和和平方和，看看你是否可以计算你自己的R ²和调整后的R ²值，看它们是否匹配

R平方并用一个预测器调整R平方

1 个答案: