假设我运行贝叶斯简单线性回归。我想通过基于(截距)和b(斜率)的后验分布绘制多条回归线来可视化结果。我想知道如何以类似热图的方式显示结果,或者使用透明度来避免重叠。这是一个简单的ggplot方法。
library(ggplot2)
set.seed(123)
N = 1000
x = 1:80
a = rnorm(N,10,3)
b = rnorm(N,5,2)
y = vector("list",length=N)
for(i in 1:N) {y[[i]] = a[i]+b[i]*x}
df = data.frame(x=rep(x,N),y=unlist(y))
df$f = rep(1:N,each=80)
(plt <- ggplot(df, aes(x, y,group=f)) +
geom_jitter(alpha=1/30,width=5,col="blue") + theme_classic())
有更好的方法吗?如果颜色会根据重叠量(就像在热图中那样)而改变,那将是很好的。
答案 0 :(得分:5)
为什么不用后验样本绘制线图
g = ggplot(df, aes(x, y)) +
geom_line(alpha=1/50,col="grey",aes(group=f)) +
theme_classic()
然后,然后为后路添加一条较暗的线
g + stat_summary(geom="line", fun.y=mean, color="black", lwd=1)
给予
答案 1 :(得分:4)
您可以通过stat_density_2d
功能ggplot2
来实现此目的。有很多种方法可以做到这一点。使用df
...
作为热图
ggplot(df, aes(x = x, y=y))+
stat_density_2d(aes(fill = ..density..), geom = "raster", contour = FALSE)+
scale_fill_gradient(low = "blue", high = "red")+
stat_summary(geom="line", fun.y=mean, color = "white",lwd=1)+
theme_classic()
相反,您也可以使用积分。
ggplot(df, aes(x = x, y=y))+
stat_density_2d(aes(size = ..density..), geom = "point", contour = FALSE)+
stat_summary(geom="line", fun.y=mean, color = "white",lwd=1)+
theme_classic()