我有一个正态分布的自变量。我想对它们进行分类,并绘制每个分类的因变量平均值。我可以对等宽的垃圾箱执行此操作,但是我想使用具有相同观察次数的垃圾箱。
我在弄清楚使用哪个函数来计算箱宽度时遇到麻烦。还是最好单独找出中断点并列出来?
这将生成具有均匀bin宽度的图形
a <- rnorm(1000, sd = 200)
b <- runif(1000)
df <- data.frame(a, b)
ggplot(data = df, aes( x = a, y = b)) + geom_point(alpha = 0.1) +
stat_summary_bin(fun.y = mean, binwidth = 5, geom = "point", color = "red")
所以我认为我需要一个用于binwidth的函数吗?还是使用中断而不是设置binwidth更好?如果是这样,则不确定如何在它们之间的大小均等的人群中休息。
答案 0 :(得分:0)
您是否尝试过使用函数quantile()
计算变量的分位数,然后按照建议使用breaks
?