Question

当我尝试使用线性回归模型围绕两个连续变量和两个分类变量（可能充当虚拟变量）进行预测和置信区间时，两个区间的结果完全相同。我正在使用predict（）函数。

我已经尝试使用其他具有连续变量和离散变量，但没有分类变量或二分变量的数据集，并且间隔不同。我尝试从回归模型中删除一些变量，并且间隔仍然相同。另一方面，我已经将我的data.frame与R文档中示例的进行了比较，我认为问题不存在。

#linear regression model: modeloReducido
summary(modeloReducido)

> Call: lm(formula = V ~ T * W + P * G, data = Datos)
> 
> Residuals:
>     Min      1Q  Median      3Q     Max 
> -7.5579 -1.6222  0.3286  1.6175 10.4773 


 Coefficients:

       Estimate Std. Error t value Pr(>|t|)     
(Intercept)   0.937674   3.710133   0.253 0.800922
 T           -12.864441   2.955519  -4.353 2.91e-05 *** 
 W             0.013926   0.001432   9.722  < 2e-16 *** 
 P            12.142109   1.431102   8.484 8.14e-14 ***
 GBaja        15.953421   4.513963   3.534 0.000588 ***
 GMedia        0.597568   4.546935   0.131 0.895669
 T:W           0.014283   0.001994   7.162 7.82e-11 ***
 P:GBaja      -3.249681   2.194803  -1.481 0.141418
 P:GMedia     -5.093860   2.147673  -2.372 0.019348 *


> --- Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> 
> Residual standard error: 3.237 on 116 degrees of freedom Multiple
> R-squared:  0.9354,   Adjusted R-squared:  0.931  F-statistic:   210 on
> 8 and 116 DF,  p-value: < 2.2e-16

#Prediction Interval
newdata1.2 <- data.frame(T=1,W=1040,P=10000,G="Media")
#EP


 opt1.PI <- predict.lm(modeloReducido, newdata1.2,
     interval="prediction", level=.95)

#Confidence interval
newdata1.1 <- data.frame(T=1,W=1040,P=10000,G="Media")
#EP

opt1.CI <- predict(modeloReducido, newdata1.1, 
    interval="confidence", level=.95)
opt1.CI
#fit      lwr      upr 
#1 70500.51 38260.24 102740.8

opt1.PI
#   fit      lwr      upr
#  1 70500.51 38260.24 102740.8

opt1.PI和opt1.CI应该不同。

我给出的Excel文件在以下链接中： https://www.filehosting.org/file/details/830581/Datos%20Tarea%204.xlsx

R：使用predict（）获得相同的置信度和预测间隔值

0 个答案: