如果这个问题非常简单,我很抱歉,但我无法找到解决问题的方法。我想用ggplot2绘制逻辑回归线。问题是我无法使用geom_abline
,因为我没有原始模型,只有每条回归线的斜率和截距。我已经使用这种方法进行线性回归,这对geom_abline
很好,因为你可以给函数提供多个斜率和截距。
geom_abline(data = estimate,aes(intercept = inter,slope = slo)
其中inter
和slo
是具有多个值的向量。
如果我使用逻辑回归的系数尝试相同的方法,我将得到错误的回归线(线性)。我试图使用geom_line,但是,我不能使用函数predict
来生成预测值,因为我没有原始模型对象。
有什么建议吗?
提前致谢, 古斯塔沃
答案 0 :(得分:3)
如果模型具有logit链接,那么您可以仅使用截距(coefs[1]
)和斜率(coefs[2]
)绘制预测:
library(ggplot2)
n <- 100L
x <- rnorm(n, 2.0, 0.5)
y <- factor(rbinom(n, 1L, plogis(-0.6 + 1.0 * x)))
mod <- glm(y ~ x, binomial("logit"))
coefs <- coef(mod)
x_plot <- seq(-5.0, 5.0, by = 0.1)
y_plot <- plogis(coefs[1] + coefs[2] * x_plot)
plot_data <- data.frame(x_plot, y_plot)
ggplot(plot_data) + geom_line(aes(x_plot, y_plot), col = "red") +
xlab("x") + ylab("p(y | x)") +
scale_y_continuous(limits = c(0, 1)) + theme_bw()
这里有一种方法可以在前一段代码的同一图表上绘制k
预测概率线:
library(reshape2)
k <- 5L
intercepts <- rnorm(k, coefs[1], 0.5)
slopes <- rnorm(k, coefs[2], 0.5)
x_plot <- seq(-5.0, 5.0, by = 0.1)
model_predictions <- sapply(1:k, function(idx) {
plogis(intercepts[idx] + slopes[idx] * x_plot)
})
colnames(model_predictions) <- 1:k
plot_data <- as.data.frame(cbind(x_plot, model_predictions))
plot_data_melted <- melt(plot_data, id.vars = "x_plot", variable.name = "model",
value.name = "y_plot")
ggplot(plot_data_melted) + geom_line(aes(x_plot, y_plot, col = model)) +
xlab("x") + ylab("p(y | x)") +
scale_y_continuous(limits = c(0, 1)) + theme_bw()