绘制一些数据的密度会产生Y轴上的频率,而绘制其他数据的密度会产生Y轴上的概率(?)。密度()的freq = FALSE是否与hist()相同,所以我可以控制它?我已经尝试过搜索这个特定的问题,但我几乎总是得到hist()文档,而不是找到这个特定问题的答案。谢谢!
答案 0 :(得分:2)
由于@MrFlick表达的原因,在密度上添加这样的参数在统计上是不明智的。如果要将密度估计值转换为与观测值相同的比例,则可以乘以用于密度计算的矢量的长度。然后密度成为“频率”的“每x单位”估计。比较两个图:
set.seed(123);x <- sample(1:10, size=5 )
#> x
#[1] 3 8 4 7 6
plot(density(x))
plot(5*density(x)$y)
“每单位x”估计现在处于0.5的正确(近似)范围内(并且它的积分应大致等于计数)。只是意外地,密度的x值将与概率相似。始终应该是密度的积分是一致的。
也许您正在寻找ecdf
功能?它不是返回密度,而是提供构造累积概率函数的机制。