昨天我worked up an example of普通最小二乘法(OLS)与主成分分析(PCA)之间的区别。为了说明我想要显示OLS和PCA最小化的错误,所以我绘制了实际值,预测线,然后我手动(使用GIMP)绘制了一条下拉线来说明一些错误术语。如何编写R中错误行的创建?这是我用于示例的代码:
set.seed(2)
x <- 1:100
y <- 20 + 3 * x
e <- rnorm(100, 0, 60)
y <- 20 + 3 * x + e
plot(x,y)
yx.lm <- lm(y ~ x)
lines(x, predict(yx.lm), col="red")
然后我手动添加黄线以产生以下内容:
答案 0 :(得分:9)
?segments
我提供了一个例子,但今天我很忙,选择积分并不复杂。 ; - )
好的,所以我那忙......
n=58; segments(x[n],y[n],x[n],predict(yx.lm)[n])
n=65; segments(x[n],y[n],x[n],predict(yx.lm)[n])
答案 1 :(得分:7)
正如约书亚所说,segments()
是前往这里的方式。由于它是完全矢量化的,我们可以一次性添加所有错误,继续您的示例
set.seed(2)
x <- 1:100
y <- 20 + 3 * x
e <- rnorm(100, 0, 60)
y <- 20 + 3 * x + e
plot(x,y)
yx.lm <- lm(y ~ x)
lines(x, predict(yx.lm), col="red")
## Add segments
segments(x, y, x, fitted(yx.lm), col = "blue")
如果您只想突出显示几个错误,那么修改Joshua给出的示例:
n <- c(58,65)
segments(x[n], y[n], x[n], fitted(yx.lm)[n], col = "orange", lwd = 3)
HTH