我想要拟合一个没有斜率的线性模型并提取它的信息。我的目标是知道哪个是数据集中水平线的最佳y截距,并从导出的线性拟合中评估以确定 y 是否具有特定行为( x 是日期)。我使用range
来评估行为,但我正在寻找一个没有单位的索引。
删除y-intercept:
X <- 1:10
Y <- 2:11
lm1 <- lm(Y~X + 0, data = data.frame(X=X,Y=Y)) # y-intercept remove opt 1
lm1 <- lm(Y~X - 1, data = data.frame(X=X,Y=Y)) # y-intercept remove opt 2
lm1 <- lm(Y~0 + X, data = data.frame(X=X,Y=Y)) # y-intercept remove opt 3
lm1$coefficients
X
1.142857
summary(lm1)$r.squared
[1] 0.9957567
以前显示的所有lm
都有。但是,如果我评估:
lm2 <- lm(Y~1, data = data.frame(X=X,Y=Y))
lm2$coefficients
(Intercept)
6.5
summary(lm2)$r.squared
[1] 0
有一种方法可以从lm
函数计算或计算索引来确定 y 由水平线表示多少?
答案 0 :(得分:5)
让lmObject
成为lm
返回的线性模型(使用y = TRUE
调用以返回y
)。
如果您的模型有截距,则R平方计算为
with(lmObject, 1 - c(crossprod(residuals) / crossprod(y - mean(y))) )
如果您的模型没有截距,则R平方计算为
with(lmObject, 1 - c(crossprod(residuals) / crossprod(y)) )
注意,如果你的模型只是一个拦截(所以它肯定来自上面的第一种情况),你有
residuals = y - mean(y)
因此R平方总是1 - 1 = 0
。
在回归分析中,始终建议在模型中包含截距以获得无偏估计。仅具有拦截的模型是NULL模型。将任何其他模型与此NULL模型进行比较,以进一步分析方差。
一张纸条。您想要的价值/数量与回归无关。您可以简单地将其计算为
c(crossprod(Y - mean(Y)) / crossprod(Y)) ## `Y` is your data
#[1] 0.1633663
或者,使用
(length(Y) - 1) * var(Y) / c(crossprod(Y))
#[1] 0.1633663