r中没有斜率的线性拟合

时间:2016-11-11 16:12:00

标签: r regression linear-regression lm

我想要拟合一个没有斜率的线性模型并提取它的信息。我的目标是知道哪个是数据集中水平线的最佳y截距,并从导出的线性拟合中评估R2以确定 y 是否具有特定行为( x 是日期)。我使用range来评估行为,但我正在寻找一个没有单位的索引。

删除y-intercept:

X <- 1:10

Y <- 2:11

lm1 <- lm(Y~X + 0, data = data.frame(X=X,Y=Y)) # y-intercept remove opt 1

lm1 <- lm(Y~X - 1, data = data.frame(X=X,Y=Y)) # y-intercept remove opt 2

lm1 <- lm(Y~0 + X, data = data.frame(X=X,Y=Y)) # y-intercept remove opt 3

lm1$coefficients
       X 
1.142857 

summary(lm1)$r.squared    
[1] 0.9957567

以前显示的所有lm都有R2。但是,如果我评估:

lm2 <- lm(Y~1, data = data.frame(X=X,Y=Y))

lm2$coefficients
(Intercept) 
        6.5 

summary(lm2)$r.squared
[1] 0

有一种方法可以从lm函数计算R2或计算索引来确定 y 由水平线表示多少?

1 个答案:

答案 0 :(得分:5)

lmObject成为lm返回的线性模型(使用y = TRUE调用以返回y)。

  • 如果您的模型有截距,则R平方计算为

    with(lmObject, 1 - c(crossprod(residuals) / crossprod(y - mean(y))) )
    
  • 如果您的模型没有截距,则R平方计算为

    with(lmObject, 1 - c(crossprod(residuals) / crossprod(y)) )
    

注意,如果你的模型只是一个拦截(所以它肯定来自上面的第一种情况),你有

residuals = y - mean(y)

因此R平方总是1 - 1 = 0

在回归分析中,始终建议在模型中包含截距以获得无偏估计。仅具有拦截的模型是NULL模型。将任何其他模型与此NULL模型进行比较,以进一步分析方差。

一张纸条。您想要的价值/数量与回归无关。您可以简单地将其计算为

c(crossprod(Y - mean(Y)) / crossprod(Y))  ## `Y` is your data
#[1] 0.1633663

或者,使用

(length(Y) - 1) * var(Y) / c(crossprod(Y))
#[1] 0.1633663