所以,我试图在数据帧上绘制直方图 - > y为列 - > ProsperRating..numeric。 (变量名称末尾有一段时间)。
所以,这是我到目前为止所做的。 (在覆盖正常曲线后)。
h <- hist(y$ProsperRating..numeric.,breaks = c(0,1,2,3,4,5,6,7))
xfit <- seq(min(y$ProsperRating..numeric.) , max(y$ProsperRating..numeric.) , length = nrow(y))
yfit <- dnorm(xfit, mean = mean(y$ProsperRating..numeric.), sd = sd(y$ProsperRating..numeric.))
yfit <- yfit * length(y$ProsperRating..numeric.) *diff(h$mids[1:2]) * 1.8
lines(xfit,yfit,lwd = 2)
Histogram plot - Notice 1 and 2 numbered bins sticking together
我还有其他办法吗?总的菜鸟到R。
编辑1:繁荣评级数字是我的数据框中的一列。它包含值1-7,增量为1(x = seq(1,7,1)
)。这就是我试图在这里绘制的内容。
编辑2:添加新的法线曲线。更改了代码以反映中断。 New Normal Curve! 如果做得好,毫无头绪。
答案 0 :(得分:0)
休息只是一个建议。
set.seed(1337)
hist(runif(20,1,10), breaks = 3) # only shows two bins
显式控制bin大小的唯一方法,假设这将纠正你的图形。是将断点设置为x轴断点位置的矢量。
set.seed(1337)
hist(rnorm(20), breaks = c(-3,-2,-1,0,1,2,3))
据说这些垃圾箱“粘在一起”,因为这正是它应该看起来的样子。在1.5和2之间有接近1000个观察值。您可以通过添加它们之间不存在数据的bin来分隔它们,或者在不查看数据的情况下,添加从0到1的bin可能会修复视觉问题{{ 1}}。
我建议这样做。
breaks = c(0,1,2,3,4,5,6,7)
除去所有空间,我认为无论如何都要好好看看。