我正在尝试想象连续x
和二元y
(inspiration)之间的关系
set.seed(1032490)
NN = 2e5
DF = data.frame(x = rlnorm(NN))
DF$y = as.numeric(DF$x - mean(DF$x) + rnorm(NN) > 0)
ggplot(DF, aes(x, y)) +
stat_smooth(method = 'gam') +
geom_rug(sides = 'b')
当然,有了这么多要点,地毯不是很有用,它也会大大减慢绘图速度。
更快,更可解释的是用箱线图(或其他分布总结图)替换geom_rug
。
有没有开箱即用的方法吗?我玩geom_boxplot
并检查文档无济于事。