R离散变量上的直方图 - 两个箱子粘在上面

时间:2016-10-25 05:49:31

标签: r ggplot2

所以,我试图在数据帧上绘制直方图 - > y为列 - > ProsperRating..numeric。 (变量名称末尾有一段时间)。

所以,这是我到目前为止所做的。 (在覆盖正常曲线后)。

h <- hist(y$ProsperRating..numeric.,breaks = c(0,1,2,3,4,5,6,7)) 
xfit <- seq(min(y$ProsperRating..numeric.) , max(y$ProsperRating..numeric.) , length = nrow(y))
yfit <- dnorm(xfit, mean = mean(y$ProsperRating..numeric.), sd = sd(y$ProsperRating..numeric.))
yfit <- yfit * length(y$ProsperRating..numeric.) *diff(h$mids[1:2]) * 1.8 
lines(xfit,yfit,lwd = 2)

Histogram plot - Notice 1 and 2 numbered bins sticking together

我还有其他办法吗?总的菜鸟到R。

编辑1:繁荣评级数字是我的数据框中的一列。它包含值1-7,增量为1(x = seq(1,7,1))。这就是我试图在这里绘制的内容。

编辑2:添加新的法线曲线。更改了代码以反映中断。 New Normal Curve! 如果做得好,毫无头绪。

1 个答案:

答案 0 :(得分:0)

休息只是一个建议。

set.seed(1337)
hist(runif(20,1,10), breaks = 3) # only shows two bins

显式控制bin大小的唯一方法,假设这将纠正你的图形。是将断点设置为x轴断点位置的矢量。

set.seed(1337)
hist(rnorm(20), breaks = c(-3,-2,-1,0,1,2,3))

据说这些垃圾箱“粘在一起”,因为这正是它应该看起来的样子。在1.5和2之间有接近1000个观察值。您可以通过添加它们之间不存在数据的bin来分隔它们,或者在不查看数据的情况下,添加从0到1的bin可能会修复视觉问题{{ 1}}。

我建议这样做。

breaks = c(0,1,2,3,4,5,6,7)

除去所有空间,我认为无论如何都要好好看看。