有很多帖子回答了如何绘制正态分布曲线以与数据集变量的直方图进行比较的想法。我本人亲自去做下面的解释https://www.youtube.com/watch?v=6eiwcd4Z3jc
因为它似乎是最简单的。
只想了解和学习为什么会发生此错误,以及如何避免该错误。这是我遵循的过程:
1)我创建了一个非常标准的直方图,在这种情况下,我的数据集被称为datospractica
hist(datospractica$VENTAS)
2)之后,我根据数据集的长度,数据集的平均值和数据集的典型偏差创建了一个正态分布样本。
normalobject <-rnorm(length(datospractica$VENTAS), mean(datospractica$VENTAS),sd(datospractica$VENTAS))
3)最后,我添加了正态分布的图形表示形式
lines(density(normalobject, adjust = 2), col = "Blue" , lwd = 2)
那么,这是什么意思呢?为什么用这种方式表示(我想做的想法是,看到曲线与直方图重叠,但是似乎它们在不同的比例尺上运行)。
我是R的新手,还是统计的新手,您能提供和帮助的任何文档都受到好评。