如何解释R归纳的线性回归系数?

时间:2019-09-16 11:50:52

标签: r statistics linear-regression

请在下面找到reprex:

library(tidyverse)

# Work days for January from 2010 - 2018
data = data.frame(work_days = c(20,21,22,20,20,22,21,21),
           sale = c(1205,2111,2452,2054,2440,1212,1211,2111))

# Apply linear regression
model = lm(sale ~ work_days, data)

summary(model)
Call:
lm(formula = sale ~ work_days, data = data)

Residuals:
   Min     1Q Median     3Q    Max 
-677.8 -604.5  218.7  339.0  645.3 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  2643.82    5614.16   0.471    0.654
work_days     -38.05     268.75  -0.142    0.892

Residual standard error: 593.4 on 6 degrees of freedom
Multiple R-squared:  0.00333,   Adjusted R-squared:  -0.1628 
F-statistic: 0.02005 on 1 and 6 DF,  p-value: 0.892

请您帮我了解一下系数 每个工作日销售量减少38.05 吗?


data = data.frame(work_days = c(20,21,22,20,20,22,21,21),
           sale = c(1212,1211,2111,1205,2111,2452,2054,2440))

model = lm(sale ~ work_days, data)

summary(model)
Call:
lm(formula = sale ~ work_days, data = data)

Residuals:
   Min     1Q Median     3Q    Max 
-686.8 -301.0   -8.6  261.3  599.7 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  -6220.0     4555.9  -1.365    0.221
work_days      386.6      218.1   1.772    0.127

Residual standard error: 481.5 on 6 degrees of freedom
Multiple R-squared:  0.3437,    Adjusted R-squared:  0.2343 
F-statistic: 3.142 on 1 and 6 DF,  p-value: 0.1267

是这个意思,

每个工作日销售量增加387吗? 否定截距怎么样?

类似的问题,但无法应用这些知识:

Interpreting regression coefficients in R

Interpreting coefficients from Logistic Regression from R

Linear combination of regression coefficients in R

2 个答案:

答案 0 :(得分:2)

  

请问我是否能将系数每个工作日的销售量减少38.05

是,不是。仅给出8个数据点,最佳回归线的负斜率为-38.05,这似乎违反直觉。

但是,您需要考虑此-38.05值的标准误差268.75。因此,结果可以转换为“在此示例中,斜率看起来为负,但也可能为正,'-38.05 + 2 * 268.75'和'-38.05-2 * 268.75'之间的任何值都是合理的猜测。因此,请勿将这个小样本推断为该样本以外的任何其他内容。

也看看

Multiple R-squared:  0.00333

这意味着,用这种回归可以解释少于1%的样本方差。请勿认真对待,并尝试从这么小的样本中解释数字。

  

每个工作日销售量增加387吗?否定截距怎么样?

仅从您调查的小样本来看,每个工作日的销售额看起来增加了387。但是,标准误很高,因此您无法确定额外工作日是增加还是减少了该小样本之外的销售额。整个模型并不重要,因此没有人声称,该模型比单纯的猜测要好。

  

否定截距如何?

您强制计算机计算线性模型。该模型将允许您计算愚蠢的值,例如“如果销售是工作日的线性函数,而一个月的工作日为负或零,该怎么办?”您当然可以强迫R预测线性模型,其中零工作日导致零销售,这使我们重新回到主题上。强制R通过点(0; 0)计算模型采用以下语法:

model <- lm(sales ~ work_days - 1, data = data)

答案 1 :(得分:1)

sale等于work_days时,回归线的截距被解释为预测的zero。如果预测变量(在这种情况下为work_days不能为零,则没有意义。回归线或预测估计值-38.5的斜率可以解释为work_days的每增加一次,销售度量值减少-38.05