geom_smooth比nls单独给出不同的拟合

时间:2017-03-08 14:14:44

标签: r ggplot2 nls

因为我想分别使用nls模型,所以我在geom_smooth函数和ggplot外面的数据中做了一个拟合:

library(ggplot2)
set.seed(1)
data <- data.frame(x=rnorm(100))
a <- 4
b <- -2
data$y <- with(data, exp(a + b * x) + rnorm(100) + 100)
mod <- nls(formula = y ~ (exp(a + b * x)), data = data, start = list(a = a, b = b))
data$fit <- predict(mod, newdata=data)

plot <- ggplot(data, aes(x=x, y=y)) + 
    geom_point() + 
    geom_smooth(method = "nls", colour = "red", formula=y ~ exp(a + b * x),
                method.args = list(start = c(a = a, b = b)), se=F, span=0) + 
    geom_line(aes(x=x, y=fit), colour="blue") +
    scale_y_log10()

enter image description here

我只是想知道为什么这两种方法虽然具有相同的参数,却给出了不同的拟合? geom_smooth会使用一些转换吗?

1 个答案:

答案 0 :(得分:7)

geom_smooth不会根据原始数据集进行预测,而是生成用于预测的数据集。默认情况下,此数据集有80行,但您可以使用n参数更改此行。

要查看模型是否适合geom_smooth并且nls拟合的模型是相同的,您需要使用相同的数据集进行预测。您可以通过geom_smooth提取ggplot_build使用的那个。用于预测的数据集是列表中的第二个。

dat2 = ggplot_build(plot)$data[[2]]

现在使用dat2从nls模型进行预测并重新绘制图。

dat2$fit2 = predict(mod, newdata = dat2)

ggplot(data, aes(x=x, y=y)) + 
    geom_point() + 
    geom_smooth(method = "nls", colour = "red", formula=y ~ exp(a + b * x),
              method.args = list(start = c(a = 4, b = -2)), se = FALSE) + 
    geom_line(data = dat2, aes(x=x, y=fit2), colour="blue")

enter image description here

请注意,如果您希望在将geom_smooth与预测线进行比较时显示log10比例,则需要使用coord_trans(y = "log10")代替scale_y_log10。在模型拟合之前进行缩放变换,因此如果使用scale_y_log10,则可以将模型拟合到log10变换后的y。