逻辑回归的geom_abline(ggplot2)

时间:2015-08-26 11:19:18

标签: r ggplot2 logistic-regression

如果这个问题非常简单,我很抱歉,但我无法找到解决问题的方法。我想用ggplot2绘制逻辑回归线。问题是我无法使用geom_abline,因为我没有原始模型,只有每条回归线的斜率和截距。我已经使用这种方法进行线性回归,这对geom_abline很好,因为你可以给函数提供多个斜率和截距。

  

geom_abline(data = estimate,aes(intercept = inter,slope = slo)

其中interslo是具有多个值的向量。

如果我使用逻辑回归的系数尝试相同的方法,我将得到错误的回归线(线性)。我试图使用geom_line,但是,我不能使用函数predict来生成预测值,因为我没有原始模型对象。

有什么建议吗?

提前致谢, 古斯塔沃

1 个答案:

答案 0 :(得分:3)

如果模型具有logit链接,那么您可以仅使用截距(coefs[1])和斜率(coefs[2])绘制预测:

library(ggplot2)

n <- 100L
x <- rnorm(n, 2.0, 0.5)
y <- factor(rbinom(n, 1L, plogis(-0.6 + 1.0 * x)))

mod <- glm(y ~ x, binomial("logit"))
coefs <- coef(mod)

x_plot <- seq(-5.0, 5.0, by = 0.1)
y_plot <- plogis(coefs[1] + coefs[2] * x_plot)

plot_data <- data.frame(x_plot, y_plot)

ggplot(plot_data) + geom_line(aes(x_plot, y_plot), col = "red") + 
        xlab("x") + ylab("p(y | x)") +
        scale_y_continuous(limits = c(0, 1)) + theme_bw()

plot 1

修改

这里有一种方法可以在前一段代码的同一图表上绘制k预测概率线:

library(reshape2)

k <- 5L

intercepts <- rnorm(k, coefs[1], 0.5)
slopes <- rnorm(k, coefs[2], 0.5)

x_plot <- seq(-5.0, 5.0, by = 0.1)
model_predictions <- sapply(1:k, function(idx) {
            plogis(intercepts[idx] + slopes[idx] * x_plot)
        })

colnames(model_predictions) <- 1:k
plot_data <- as.data.frame(cbind(x_plot, model_predictions))
plot_data_melted <- melt(plot_data, id.vars = "x_plot", variable.name = "model", 
        value.name = "y_plot")

ggplot(plot_data_melted) + geom_line(aes(x_plot, y_plot, col = model)) + 
        xlab("x") + ylab("p(y | x)") +
        scale_y_continuous(limits = c(0, 1)) + theme_bw()

plot 2