使用以下方法估算MATLAB中的确定系数:
load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));
X2 = X(:,3);
mdl = fitlm(X2,y);
Estimated Coefficients:
Estimate SE tStat pValue
________ ________ ______ __________
(Intercept) 116.72 3.9389 29.633 1.0298e-50
x1 0.039357 0.025208 1.5613 0.12168
Number of observations: 100, Error degrees of freedom: 98
Root Mean Squared Error: 6.66
R-squared: 0.0243, Adjusted R-Squared 0.0143
F-statistic vs. constant model: 2.44, p-value = 0.122
如果我只在线性模型中使用一个预测变量,为什么R 2 和adjust-R 2 值不相同。如果模型中只有一个预测变量,则它们应该是可互换的。我在这里错过了什么?
答案 0 :(得分:5)
维基百科给出了adjust-R 2 的两个定义:
和
我猜你的断言R 2 应该等于adjust-R 2 是基于第一个等式,因为 p 1 第二项的分子是 0 。现在我找不到这方面的参考(令人失望的是,维基文章的这一部分没有引用)但我相当确信第一个方程实际上是近似值。
除了符号之外,第二个等式也匹配Introduction to Statistical Learning第212页上的等式6.4,与R 2 不同,因为 df e 是 n - p - 1 而 df t 只是 n - 1 因此当 p 等于 1 (即只有一个解释变量)时 1 的差异,但差异应该非常小。 Here is a random example,其表格为R 2 ,调整后的R 2 ,即使变量数为1,也显示出差异。
但你的差异非常大。我建议你看看剩余的平方和和平方和,看看你是否可以计算你自己的R 2 和调整后的R 2 值,看它们是否匹配