因为我想分别使用nls模型,所以我在geom_smooth函数和ggplot外面的数据中做了一个拟合:
library(ggplot2)
set.seed(1)
data <- data.frame(x=rnorm(100))
a <- 4
b <- -2
data$y <- with(data, exp(a + b * x) + rnorm(100) + 100)
mod <- nls(formula = y ~ (exp(a + b * x)), data = data, start = list(a = a, b = b))
data$fit <- predict(mod, newdata=data)
plot <- ggplot(data, aes(x=x, y=y)) +
geom_point() +
geom_smooth(method = "nls", colour = "red", formula=y ~ exp(a + b * x),
method.args = list(start = c(a = a, b = b)), se=F, span=0) +
geom_line(aes(x=x, y=fit), colour="blue") +
scale_y_log10()
我只是想知道为什么这两种方法虽然具有相同的参数,却给出了不同的拟合? geom_smooth会使用一些转换吗?
答案 0 :(得分:7)
geom_smooth
不会根据原始数据集进行预测,而是生成用于预测的数据集。默认情况下,此数据集有80行,但您可以使用n
参数更改此行。
要查看模型是否适合geom_smooth
并且nls
拟合的模型是相同的,您需要使用相同的数据集进行预测。您可以通过geom_smooth
提取ggplot_build
使用的那个。用于预测的数据集是列表中的第二个。
dat2 = ggplot_build(plot)$data[[2]]
现在使用dat2
从nls模型进行预测并重新绘制图。
dat2$fit2 = predict(mod, newdata = dat2)
ggplot(data, aes(x=x, y=y)) +
geom_point() +
geom_smooth(method = "nls", colour = "red", formula=y ~ exp(a + b * x),
method.args = list(start = c(a = 4, b = -2)), se = FALSE) +
geom_line(data = dat2, aes(x=x, y=fit2), colour="blue")
请注意,如果您希望在将geom_smooth
与预测线进行比较时显示log10比例,则需要使用coord_trans(y = "log10")
代替scale_y_log10
。在模型拟合之前进行缩放变换,因此如果使用scale_y_log10
,则可以将模型拟合到log10变换后的y。